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Einführung 


Mit dem vorliegenden Band erscheint der zweite der 2019 gestarteten Reihe 
DaF/DaZ in Forschung und Lehre, wieder getreu dem Motto: von Lehrenden 
für Lehrende. Unbedingt erwähnt werden muss, dass es sich auch bei diesem 
Band bei allen Autorinnen und Autoren wieder um Absolventinnen und Ab- 
solventen und/oder Lehrende der Johannes Gutenberg-Universität Mainz han- 
delt. Dies verdeutlicht die Qualität, mit der Lehre und Forschung vor allem im 
Masterstudiengang Deutsch als Fremdsprache/Deutsch als Zweitsprache, einem 
vergleichsweise kleinen Studiengang seiner Art, betrieben wird. Die erste inter- 
disziplinäre Zusammenarbeit mit dem Neurolinguistics Lab bestärkt die Viel- 
fältigkeit, mit der hier geforscht wird. Vielfältig sind auch die Beiträge, die sich 
in zwei Themenschwerpunkte zusammenfassen lassen: Evaluieren und Prüfen. 


Der erste Teil enthält Evaluationen von verschiedensten DaF/DaZ-Bereichen, 
wobei ein Fokus auf Formen und Möglichkeiten des digitalen Lernens liegt. 

Christina Maria Ersch stellt eine erste Evaluation des digitalen Semesters 
im Masterstudiengang Deutsch als Fremdsprache/Deutsch als Zweitsprache 
vor und zeigt, wie die Problematik der sog. digitalen Distanz, der fehlende per- 
sönliche Kontakt bei virtueller Lehre, ausgeglichen werden kann und welchen 
Einfluss dies auf die Motivation zum Lernen hat. Sie verdeutlicht dies anhand 
des Seminars zur Interkulturellen Kommunikation, das im Sommersemester 
2020 erstmalig mit dem Inverted Classroom Modell realisiert wurde. 

Marion Grein greift dieses Modell auf, das eins der fünf aktuellen Typen 
des virtuellen Sprachunterrichts darstellt. Sie fokussiert dabei ebenfalls die 
bereits erwähnte digitale Distanz und überprüft mit einer kleinen Studie mit 
Lehrenden, inwieweit das Kursformat nach dem Inverted Classroom Modell 
durch zahlreiche soziale und kollaborative Tools tatsächlich erfolgreicher ist 
als andere Formen des virtuellen Sprachunterrichts. 
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Ann-Katrin Fierus vergleicht die drei größten Anbieter von Sprachlern- 
Apps für Deutsch als Fremdsprache Babbel, Busuu und Duolingo, die durch 
Ausgangsbeschränkungen und Lockdowns vieler Länder ab März 2020 einen 
deutlichen Zuwachs an Nutzer/innen verzeichnen konnten. Sie evaluiert, ob 
und wie interkulturelle Kompetenz mit digitalen Anwendungen aufgegriffen 
wird und inwieweit Lernende dadurch für kulturelle Unterschiede sensibilisiert 
werden können. 

Virginia Sanchez Anguix stellt in ihrem Beitrag fest, dass die Relevanz der 
sozialen und personalen Kompetenzen in der Berufswelt allgemein anerkannt 
ist und für das Lehramt zumindest diskutiert wird, aber im DaF/DaZ-Bereich 
eine vergleichbare Eignungsdiskussion bisher nicht stattfindet. Sie evaluiert 
dabei die Rolle, die diese Kompetenzen bei Eignungstests für DaF/DaZ-Stu- 
dierende an verschiedenen Universitäten spielt. 

Nina Jehle präsentiert die erste Evaluation der fachärztekammerlichen 
Fachsprachenprüfung Medizin aus der Perspektive der Teilnehmenden. Die 
Ergebnisse ermöglichen einen Einblick auf die aktuelle Prüfungssituation so- 
wie in die Erfahrungswelt der Prüfungsteilnehmenden. 


Dies leitet über in den zweiten Teil des Bands, der sich dem Prüfen, genauer 
den Sprachprüfungen, widmet; ein Thema, das weiterhin ein desiderates For- 
schungsfeld darstellt. Dies liegt an der allgemeinen Problematik der Leistungs- 
messung im DaF/DaZ-Bereich bedingt durch die Faktorenkomplexion. Prü- 
fungen und Tests müssen zuverlässige und valide Ergebnisse liefern. Zugleich 
sollen sie aber auch fair und vergleichbar sein (vgl. Rossa 2016, Schmelter 2014). 
Dies stellt TestentwicklerInnen immer vor neue Herausforderungen und wird 
gleichzeitig im Bereich der Sprachprüfungen viel zu selten kritisch untersucht. 
Studien wie bspw. von Wisniewski 2010, die sich mit der Bewertervariabilität 
und gleichzeitig mit der Validität der GER-Skalen beschäftigen, sind selten zu 
finden und zudem meist durch die geringe Stichprobe nicht generalisierbar. Die 
folgenden Beiträge stellen demnach einen weiteren Schritt zu Erforschung des 
Themas Prüfen dar, wobei besonders Validität und Fairness im Fokus stehen. 
Nina Jehle vergleicht dabei die zwei gängigen Fachsprachenprüfungen im 
Bereich Medizin, die als Nachweis der von ausländischen Mediziner*innen ge- 
forderten Fachsprachenkompetenzen gelten: die fachärztekammerliche Fach- 
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sprachenprüfung Medizin von Rheinland-Pfalz und die telc Deutsch B2-C1 
Medizin Fachsprachprüfung und setzt sie dem neu entwickelten Sprachtest für 
ausländische Mediziner (kurz SAM) gegenüber, um diese hinsichtlich der An- 
forderung eines validen Nachweises zu evaluieren. 

Marion Grein stellt in ihrem Beitrag die Frage, welche Voraussetzungen 
und Kompetenzen die Prüferinnen und Prüfer haben müssen, um mündli- 
che Prüfungen abzunehmen, und wie überhaupt sichergestellt wird, dass die 
Prüfenden eine valide Einstufung vornehmen können. Sie vergleicht die Prü- 
ferqualifizierungen der drei Hochschulzugangssprachprüfungen TestDaf, telc 
C1 Hochschule und DSH. 

Joshua Ziegler und Miriam Riedinger zeigen anhand einer Studie zur 
Identifikation von deutschen Langvokalen, dass mit der Heterogenität der 
Sprachhintergründe in Sprachkursen eine Chancenungleichheit bezüglich 
Hörverstehensaufgaben einhergeht. Sie plädieren für die Berücksichtigung 
der sprachlichen Hintergründe in der Prüfungsvorbereitung und -konzeption 
sowie die Festigung der phonologischen Grundkenntnisse auch auf hohem 
Sprachniveau. 


An dieser Stelle möchte ich mich herzlich an die Mitarbeitenden des Verlags 
Astrid Matthes, Oliver Renner und nicht zuletzt Dr. Karin Timme wenden 
und ihnen für die hervorragende Unterstützung bei der Entwicklung dieses 
Bands bedanken. Ein noch größerer Dank gilt den Autorinnen und Autoren, 
die diesen Band erst möglich gemacht haben. 


Die Reihe DaF/Z in Forschung und Lehre richtet sich gezielt nicht nur an For- 
schungsinteressierte in diesem Bereich, sondern an Lehrkräfte und Prüfende, 
denen die Beiträge in dieser Reihe konkrete Vorschläge für die Umsetzung 
in die Praxis geben sollen. Ergänzt werden muss dieses Mal die Gruppe der 
Testinstitutionen und damit der TestentwicklerInnen, denn gerade der letzt- 
genannte Beitrag verdeutlicht die Evidenz, psycho- und neurolinguistische 
Befunde noch stärker in die Prüfungskonzeption mit einzubeziehen (ähnlich 
wie dies im Bereich Neurodidaktik bereits geschieht). 


Christina Maria Ersch, Mainz im Oktober 2020 
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Motivation statt Isolation - 
Evaluation der digitalen Lehrkräfteausbildung 


Einleitung 


„Die soziale Eingebundenheit - durch die Lernumgebung - ist die zentrale Vo- 
raussetzung für Motivation und Freunde am Lernen“ formuliert Grein (2020: 
0.5.) im Kontext des digitalen Sprachunterrichts. Doch wie kann motivierende 
Lehre funktionieren, wenn gemeinsame Präsenztreffen nicht stattfinden kön- 
nen? Welche Möglichkeiten gibt es, digital kollaboratives Arbeiten und damit 
den sozialen Austausch zu ermöglichen? Noch wichtiger wird dieser Aspekt 
bei den Lernenden bzw. Studierenden, die mit ihrem Studium erst begonnen 
haben bzw. beginnen werden und die dadurch wenig oder noch gar nicht sozial 
eingebunden sind. Und wie schafft man es, den individuellen Voraussetzun- 
gen der Studierenden, sei es technisch durch z.B. fehlende Hardware oder 
organisatorisch durch die Kita-Schließung während des Lockdowns, gerecht 
zu werden? 

Eine Antwort könnte die Implementierung des Inverted Classroom Modells 
mit einem starken Fokus auf kollaborativem und sozialem Austausch sein, so 
wie es im Masterstudiengang Deutsch als Fremdsprache/Deutsch als Zweit- 
sprache an der Johannes Gutenberg-Universität Mainz (JGU) im Sommerse- 
mester 2020 getestet wurde. 

Das Ziel des vorliegenden Beitrags ist aufzuzeigen, mit welchen Mitteln 
bzw. auf welche Weise digitale Lehre zielführend eingesetzt werden kann, in 
welche Richtung sich Prioritäten verlagern müssen, welche Rolle Lehrende 
einnehmen müssen und welche Voraussetzungen bzw. welche Infrastruktur 
vorhanden sein muss, um Studierende zu motivieren und dadurch zu ge- 
währleisten, dass sie trotz der ungewöhnlichen Situation dennoch die Chance 
haben, die Lernziele auch virtuell zu erreichen. Ferner wird erörtert, welche 
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Möglichkeiten es gibt, eine „Zoom-Fatigue“ zu vermeiden (vgl. dazu Heise 
2020: 0.S.), d.h. wie müssen synchrone Lehrangebote, die ohne Zweifel ein 
wichtiger Bestandteil der Lehre sind, aufgrund der kürzeren Aufmerksamkeits- 
spanne in virtuellen Lernumgebungen (vgl. dazu die neurobiologische Studie 
von Chen et al. 2017 zu Aufmerksamkeitsspanne beim E-Learning) gestaltet 
sein. Im Zentrum stehen dabei die Erfahrungen der Studierenden selbst, die 
durch die Corona-Pandemie im Hochschulbereich die größten Einschränkun- 
gen erfahren haben (vgl. Traus et al. 2020: 5f.). 

Im ersten Kapitel erfolgt ein kurzer Überblick zur Ausgangssituation und 
zu den ersten Ergebnissen von Studierendenbefragungen. Im Anschluss erfolgt 
die Vorstellung zweier didaktischer Ansätze, die während des digitalen Semes- 
ters im Master DaF/DaZ eingesetzt wurden (Kapitel 1.2). Dabei wird vor allem 
auf die Seminare nach dem Inverted Classroom Modell (ICM) eingegangen und 
das Konzept und der Aufbau eines praxisintensiven Seminars zu Interkultura- 
lität, das im Besonderen von Interkation und Kommunikation lebt, skizziert 
(Kapitel 1.3). Daran anschließend werden im zweiten Kapitel die Ergebnisse 
einer qualitativen Vorstudie präsentiert, in der die Studierenden auf freiwilliger 
Basis allgemeine Aussagen zum digitalen Semester treffen sollten. Anhand 
dieser Aussagen wurde eine Befragung aller Studierenden generiert, um die- 
se ersten Einschätzungen zu quantifizieren. Im Fokus der Online-Befragung 
stand die organisatorisch-technische Gestaltung der Seminare, die verschiede- 
nen Aufgabenformen wie Forenbeiträge oder Erklärvideos und insbesondere 
die Möglichkeit zur persönlichen Kontaktaufnahme zu KommilitonInnen und 
die Betreuung bzw. Erreichbarkeit der Dozentinnen. 

Im Fazit wird auf die Möglichkeiten eingegangen, welche die virtuelle Lehre 
ermöglicht. Klar ist, dass eine noch stärkere Sensibilisierung für die Bedürf- 
nisse der Studierenden in Bezug auf ihre individuelle, in diesem Falle virtuelle 
Lernumgebung erfolgen und sich die Rolle der Lehrenden dabei langfristig 
ändern muss. 
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1 Die Ausgangslage und erste Ergebnisse aus Studien 
zum digitalen Sommersemester 2020 


Welchen zahlreichen Herausforderungen sich die Bildungsinstitutionen in 

Deutschland aufgrund der Pandemie seit Marz 2020 stellen mussten, wurde 

in der Presse und sicherlich an jeder einzelnen Institution mehr als deutlich. 
Die Folgen der Pandemie 


bestatigte[n...] bereits lange bekannte strukturelle Problemlagen in 
Hochschulen oder manifestierte[n...] diese sogar. Insbesondere (ma- 
terielle) Bildungsungleichheiten wurden durch die Voraussetzungen 
für das digitale Semester sichtbarer und verstärkt. So setzt z.B. ein 
vollständig digitales Studium gewisse infrastrukturelle Ressourcen der 
Studierenden voraus, die nicht von allen gewährleistet werden können. 
(Traus et al. 2020: 6) 


Fehlende Hardware bei Lehrkräften und Lernenden, unzureichende Software 
bzw. instabile Internetverbindungen und nicht zuletzt mangelnde digitale 
Kompetenzen auf beiden Seiten offenbarten, wie wenig Deutschland auf die 
digitale Lehre vorbereitet war. Doch die Forderung, digitale Inhalte in den Un- 
terricht zu integrieren, ist nicht erst seit dem Ausbruch der Corona-Pandemie 
gegenwärtig (vgl. Grein 2020: 0.S., vgl. dazu auch Grein & Strasser 2019). Dabei 
belegt das deutsche Bildungssystem in Bezug auf den Einsatz von digitalen 
Medien im Unterricht im internationalen Vergleich den hintersten Platz (vgl. 
Scheiter & Lachner 2020: 548), was durch den Aufbau einer bundesweiten 
digitalen Infrastruktur im Rahmen des Digitalpakts bis 2025 geändert werden 
soll (vgl. ebd., dazu auch DigitalPakt Schule 2019). Allein eine flächendeckende 
Umsetzung der Pläne war noch nicht erkennbar, ebenso im Hochschulbereich: 


Es wurde viele Jahre lang über die digitale Lehre nur geredet, es wurden 
Workshops abgehalten, es wurden Strategiedebatten geführt - all das hat 
uns kaum geholfen, denn die Lehre an den deutschen Hochschulen befin- 
det sich in großen Teilen immer noch im Tiefschlaf (Handke 2020: 34). 
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Wurde die Situation an den Hochschulen vergleichsweise wenig in der Presse 
thematisiert (anders als zur Situation an den Regelschulen), war diese dort 
nicht weniger prekar, zumal bis dato von einem eingeschrankten Regelbetrieb, 
wie es bspw. in Regelschulen oder Sprachschulen seit Ende der Sommerferien 
praktiziert wird, nicht gesprochen werden kann. Zwar gibt es Pläne zu hy- 
briden Veranstaltungsformen, die Präsenzlehre in limitierter Form zulassen, 
aber der Großteil der universitären Lehre wird aufgrund der fehlenden festen 
Lerngruppen und nicht realisierbaren Kontaktlimitierung und -verfolgung bis 
ins Jahr 2021 noch (hauptsächlich) digital stattfinden müssen. 

An vielen Universitäten wurde durch vereinzelte Erhebungen versucht, 
die Missstände, aber vor allem die Erfahrungen der MitarbeiterInnen und 
Studierenden aufzuzeigen, um ein möglichst genaues Bild bzw. einen Plan 
für das Wintersemester 2020/2021 bereitzustellen (siehe dazu die Studien 
bspw. der Universität Greifswald’ oder an der TU Dresden’). Fokus war dabei 
häufig die organisatorische bzw. die technische Seite des digitalen Semesters. 
Eine deskriptive Untersuchung erfolgte an der Universität Hildesheim, die mit 
Stu.diCo - Studieren digital in Zeiten von Corona eine erste bundesweite Studie 
zu den Erfahrungen der Studierenden mit dem digitalen Semester durchge- 
führt hat (vgl. Traus et al. 2020). 

Auch die JGU evaluierte das Sommersemester durch eine Befragung der 
Lehrenden und der Studierenden und schöpfte vor allem aus einzelnen Erfah- 
rungsberichten (vgl. dazu CHANCEN JGU). Klar ist, dass die Studierenden 
das Erreichen der Studienziele etwas kritischer sahen, als die Lehrenden ihre 
Lehrziele (vgl. Videobotschaft Wie ist das digitale Sommersemester gelaufen? 
Impulse der Vizepräsidenten für den Digitalen Tag der RMU 2020°), ebenso 
unterscheiden sich die Präferenzen der Studierenden und Lehrenden in Be- 
zug auf asynchrone bzw. synchrone Lehrangebote (vgl. ebd.), bei denen die 


1 Ergebnisse der qualitativen, unsystematischen Befragung unter Germanistik Studierenden, 
https://t.co/gDKjPDzrCv?amp=1, 24.09.2020. 


2 Studierendenbefragung zur digitalen Lehre in Zeiten der Corona-Krise, https://tu-dresden. 
de/gsw/phil/powi/polsys/ressourcen/dateien/forschung/umfrage-digitale-lehre/studierenden 
befragung-digitale-lehre.pdf/at_download/file , 24.09.2020. 


3 Abrufbar unter: https://www.rhein-main-universitaeten.de/news/wie-ist-das-digitale-sommer- 
semester-gelaufen-impulse-der-vizepraesidenten-fuer-den-digitalen, 23.11.2020. 
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Studierenden asynchrone Lehrangebote eher bevorzugen als die Lehrenden. 
Die Ausgangslage war für die verschiedenen Fachbereiche ebenso heterogen, 
was aber auch in „normalen“ Zeiten aufgrund der unterschiedlichen Studien- 
inhalte und -strukturen der Fall ist. Daher ist auch verständlich, dass nicht ein 
„Masterplan“ für alle Fachbereiche erstellt werden kann, sondern durch den 
fächerübergreifenden Austausch situationsabhängige Handreichungen formu- 
liert werden können. 

Für den Masterstudiengang DaF/DaZ ergab sich eine vergleichsweise „lu- 
xuriöse“ Ausgangslage, die dazu führte, dass, neben technischen Neuerungen, 
der Blick auch auf den sozialen Aspekt des Lernens gelegt werden konnte. Dies 
war den Umständen geschuldet, dass der Studiengang schon lange digitale 
Komponenten in den Lehralltag integriert hat. Es sind für alle Seminare eige- 
ne Kurse auf der Lernplattform Moodle angelegt (seit dem Sommersemester 
werden die Kurse automatisch von Jogustine, dem Studieninformationsnetz der 
JGU, generiert, d.h. bei Anmeldung zu Seminaren werden Studierende auto- 
matisch in die entsprechenden Moodle-Kurse eingeschrieben (eine einmalige, 
separate Registrierung ist weiterhin notwendig).* 

Die Lernplattform wurde und wird weiterhin für folgende Funktionen 
genutzt: 


e Hochladen der Skripte, Handouts und Materialien für alle Seminare 

e Inhalte des Grundlagenseminars in Form von digitalen Lernpaketen 
bestehend aus Skripten, Handouts, Erklärvideos 

e Multimedia Modul mit dem Fokus auf digitalem Unterrichten 

e Hochladen der Seminarprotokolle 

+ Kommunikationsmedium für Studierende (Gruppe DaF Studis unter 
sich), aber auch zur Weitergabe studienrelevanter Informationen z.B. 
aktuelle Anmeldefristen, geänderte Bibliothekszeiten etc. durch die 
Dozentinnen. 


4 Für den Herbst 2020 war der Start einer neuen Moodle-Version vorgesehen, was aber durch 
die Corona-Pandemie auf den Start des Sommersemesters vorgezogen wurde. 
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Alle genannten Funktionen dienten in der Vergangenheit zwar lediglich als Er- 
gänzung zur Präsenzlehre, sorgten aber dafür, dass sowohl den Studierenden als 
auch den Lehrenden durch eine digitale Grundkompetenz der Umstieg auf die 
digitale Lehre zumindest technisch bzw. organisatorisch nicht allzu schwerfiel. 
Ebenso hilfreich war die Tatsache, dass es keine StudienanfängerInnen gab, 
da der Studienbeginn nur zum Wintersemester möglich ist. Dadurch konnte 
sich auf die didaktische Umsetzung einer 100% digitalen Lehre konzentriert 
werden, die aber mit den reinen Moodle-Kursen aufgrund der kompetenz- und 
kommunikationsorientierten Seminarformate nicht auskommen konnte. 
Folgende Fragen standen daher bei den Überlegungen u.a. im Fokus: 


e Wie kann digitale Lehre gestaltet werden, sodass die festgelegten 
Lernziele trotz Wegfall von Präsenzterminen erreicht werden? 

e Wie muss die Lehre gestaltet werden, damit möglichst alle Studieren- 
den gleichermaßen daran teilnehmen können? 

e Wie kann ein Studiengang, der von Kommunikation und Austausch 
lebt, der handlungs- und produktionsorientiert ist und der koopera- 
tives Arbeiten als zentrales Mittel für den Kompetenzerwerb ansieht, 
durch digitale Komponenten ergänzt werden? 

e Wie kann die sog. digitale Distanz, also der fehlende persönliche 
Kontakt, ausgeglichen werden? 


Folgt man der sozial-konstruktivistischen Lerntheorie, wird klar, dass gerade 
die beiden letzten Aspekte mit den ersteren zusammenhängen, da der Lernpro- 
zess als „eigenständige (Konstruktions-)Leistung des Lernenden im sozialen 
Kontext angesehen werden kann“ (Kergel & Heidkamp-Kergel 2020: 10). Noch 
deutlicher formuliert es Siemens (2004: 5, zit. in Kergel & Heidkamp-Kergel: 
11) mit seinem konnektivistischen Ansatz, den er für das Lernen im digitalen 
Zeitalter als zentral erachtet: „Knowledge, that resides in a database, needs to 
be connected with the right people in the right context in order to be classified 
as learning“. Zwar ist in diesem Kontext Lernen selbstgesteuert, aber immer 
auch an eine Lerngemeinschaft gebunden (vgl. ebd.). Wie dies bei rein digitaler 
Lehre didaktisch umgesetzt werden kann, wird im Folgenden an zwei Model- 
len, die im Master DaF/DaZ implementiert wurden, exemplarisch vorgestellt. 
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1.1 Didaktische Umsetzung der digitalen Lehre 


Bei der Umsetzung der im vorigen Kapitel kurz vorgestellten, konnektivis- 
tischen Lerntheorie gibt es vielfältige Möglichkeiten, die an die fachspezifi- 
schen Eigenheiten angepasst werden müssen. Die vorliegenden Modelle, die 
im Sommersemester im Master DaF/DaZ getestet wurden, lassen sich m.E. 
aber auch auf andere Fachbereiche übertragen, zumal, wie bereits erwähnt, 
zwei verschiedenen Ausrichtungen zur Anwendung kamen: 


a) Synchron: Virtuelle Seminare in Echtzeit 
b) Asynchron: Inverted Classroom Modell 


Beide Modelle beinhalten die Nutzung der Lernplattform Moodle und virtuelle 
Präsenztreffen, die von Beginn an von zentraler Bedeutung waren. Zunächst 
wird die synchrone Variante skizziert, bevor etwas ausführlicher auf das Inver- 
ted Classroom Modell anhand eines konkreten Seminarbeispiels eingegangen 


wird. 


a) Bei dieser vornehmlich synchronen Variante zu normalen Seminarzeiten 
wurden die Inhalte mit Hilfe des Videokonferenztools Zoom vermittelt. Wie 
auch in der klassischen Präsenzlehre vorgesehen, wurde der Input der Lehren- 
den durch Referate der Studierenden ergänzt; die Referierenden übernahmen 
dabei ebenfalls die Moderation der anschließenden Diskussionen. Die virtu- 
ellen Sitzungen wurden aufgezeichnet und auf der Lernplattform zum Down- 
load zur Verfügung gestellt. Dies war wesentlich, da die Anwesenheitspflicht 
ausgesetzt wurde, um die Studierenden, die bspw. Kinder oder Angehörige 
während des Lockdowns betreuen mussten, zeitlich zu entlasten. Partner- und 
Gruppenarbeiten wurden über die Breakout-Room-Funktion in Zoom reali- 
siert. Die Lernplattform Moodle wurde ferner zum Hochladen von Handouts, 
Links und das Forum für allgemeine Ankündigungen durch die Dozentin ge- 
nutzt. Ebenso der Link zu den Zoom Sitzungen wurde in den entsprechenden 
Kursen auf der Lernplattform veröffentlicht. 

Der allgemeine Kontakt zu Lehrenden verlief über E-Mail, auch zeitlich 
festgelegte, virtuelle Sprechstunden wurden zunächst über Zoom organisiert, 
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spater aber tiber Termine via Microsoft Teams. Ebenso das Masterkolloquium, 
in dem die Masterstudierenden tiber die Arbeit an ihren Abschlussarbeiten 
berichteten, lief über Zoom. 


b) Beim zweiten Modell wurde das Inverted Classroom Modell (kurz ICM, auch 
bekannt als Flipped Classroom, vgl. dazu Bühner & Sommer 2020) angewandt 
bzw. auf die Bedarfe der Studierenden angepasst. Grundsätzlich erfolgt beim 
ICM 


die Wissensaneignung durch multimediales Online-Material in indi- 
vidueller Arbeit (Out-of-Class), um die zeitlich nachgeschaltete Prä- 
senzsitzung (In-Class) für die gemeinsame, vertiefende und interaktive 
Auseinandersetzung mit dem Gelernten nutzen zu können (RUBeL: 
Was ist Inverted Classroom?). 


Ziel dieses Modells ist die Möglichkeit zur Individualisierung von Lehr-Lern- 
prozessen, indem Lernende durch digitale Elemente, wie z.B. Videos und Skrip- 
te, „zeitlich und örtlich flexibel die erforderlichen Grundlagen individuell [...] 
erarbeiten“ (RUBel: Zielsetzung und Zweck, vgl. dazu auch den Beitrag von 
Ortmann-Welp 2020) können. Dieses Modell, oft auch als Methode bezeichnet, 
wird an einigen Universitäten schon seit Jahren eingesetzt und ist demnach 
nicht neu. „Insgesamt fällt die Einschätzung des IC-Konzepts in der Literatur 
sehr durchwachsen aus - sowohl bei allgemeiner Betrachtung als auch bei der 
thematischen Eingrenzung auf Forschungsmethoden“ (Mertens et al. 2019: 18), 
doch für das rein digitale Semester bot es sich an, dieses Modell zu pilotieren. 

Die Seminare konnten im Sommersemester aus bekannten Gründen nicht 
in Präsenz stattfinden, die In-Class fand demnach rein virtuell statt. Vorab 
bearbeiteten die Studierenden mit Hilfe angefertigter Skripte die Inhalte der 
Seminare. Sie bearbeiteten Aufgaben, meist schriftlich (also Out-Of-Class), 
und, statt face-to-face, fanden die Präsenzsitzungen virtuell über MS Teams 
statt. Die Skripte enthielten konkrete Arbeitsaufträge, die obligatorisch in vor- 
gegebener Zeit bearbeitet werden mussten. Dabei handelte es sich meist nicht 
nur um „einfache“ Fragen, die z.B. in den Foren diskutiert werden sollten, 
sondern waren häufig mit kleineren Rechercheaufgaben kombiniert. Nicht 
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zuletzt sollten didaktische Überlegungen ergänzt werden. In den virtuellen 
Präsenzsitzungen über MS Teams wurden die Arbeitsaufträge bzw. „Produkte“ 
und ebenso offene Fragen diskutiert (In-Class).” Darüber hinaus wurde dieses 
Programm zu jeglicher Form von Kontaktaufnahme genutzt. Um die wöchent- 
lichen Besprechungen zu den einzelnen Seminaren zu organisieren, wurden 
dort, parallel zu den Moodle-Kursen, eigene Teams erstellt, in denen die in die 
Seminare eingeschriebenen Studierenden Zutritt hatten. 

Retrospektiv ist festzuhalten, dass damit ein virtueller Campus geschaffen 
wurde, da dort die Kommunikation in Echtzeit (im Gegensatz zu den Mög- 
lichkeiten auf Moodle) mit wenig Aufwand erfolgen konnte. Allen voran wurde 
durch Chatgruppen wie dem allgemeinen „Sprechstunden“ Chat eine Möglich- 
keit geboten, den Studierenden aus allen Semestern Informationen in Echtzeit 
zu vermitteln. Sie hatten hier die Möglichkeit, mit ihren KommiltonInnen und 
den Dozentinnen schneller Kontakt aufzunehmen, wie es über E-Mail der Fall 
ist. Es wurde außerdem ein Chat für die interne Kommunikation der Studie- 
renden eingerichtet, zu dem die Dozentinnen keinen Zutritt hatten. 

Des Weiteren wurde eine digitale Bibliothek eingerichtet, in der Links zu 
frei abrufbaren Büchern geteilt wurden oder wo Anfragen nach eingescann- 
ten Seiten aus vorherigen Semestern gestellt werden konnten, wenn diese nur 
in der Präsenzbibliothek verfügbar waren, aber durch die zeitweilige Schlie- 
Bung der Bibliotheken nicht genutzt werden konnten; ein Behelfsangebot, was, 
zusätzlich zur zeitweisen Öffnung der E-Librarys einiger großer Verlage, die 
problematische Literaturrecherche zumindest ansatzweise erleichtern konnte. 

Wie eingangs erwähnt, wird exemplarisch am Seminar „Interkulturalität: 
psychologische und didaktische Aspekte“ gezeigt, wie das ICM konkret um- 
gesetzt wurde. 


1.2 ICM im Seminar „Interkulturalität: 
psychologische und didaktische Aspekte“ 


Bei diesem Seminar stehen folgende Lernziele im Fokus: 


5 Die Besprechungen wurden aus datenschutzrechtlichen Gründen nicht aufgezeichnet (Haupt- 
grund dafür war das direkte Hochladen der Aufzeichnung in MS Stream). 
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Die Studierenden 


« verfügen über Kompetenzen zur Reflexion der wissenschaftlichen 
Modelle der Kulturbeschreibung und zur interdisziplinären Analyse 
von interkulturellen Kontakten; 

e haben ein methodisches Instrumentarium zum Kulturvergleich; 

e leisten einen Praxis-Transfer durch Anwendung von Techniken des 
Interkulturellen Trainings (aus dem Modulhandbuch für den Mas- 
terstudiengang Deutsch als Fremdsprache/Deutsch als Zweitsprache, 
Version 3/2019). 


Ganz im Sinne des learning by doing werden in diesem Seminar (normaler- 
weise) Aktivitäten zu verschiedenen Bereichen der interkulturellen Kompe- 
tenzvermittlung (vgl. Schmidt-Borcherding et al. 2020: 245ff.) getestet. Dabei 
werden Themen, die jeweils in einem Grundlagenseminar zur Interkulturel- 
len Kommunikation im Wintersemester angeboten werden, in die praktische 
Arbeit am Beispiel von Interkulturellen Trainings übertragen. Diese sind u.a. 
Culture Assimilator, Einsatz von Bildern und Filmen, interkulturelle Simula- 
tionen, Kulturrelativismus und Kulturfragebögen. 

Die Inhalte und Aufgabenstellungen finden sich in dem bereits thema- 
tisierten Skript. Das Skript wurde im Verlauf des Semesters immer wieder 
aktualisiert, um die Erfahrungen mit bereits absolvierten Einheiten berück- 
sichtigen zu können. Zur Vertiefung und Diskussionsanregung enthielt das 
Skript Arbeitsaufträge, die vornehmlich im Forum bearbeitet werden sollten. 

Ein Beispiel zu einem Arbeitsauftrag aus dem Themenbereich Einsatz von 
Bildern in interkulturellen Trainings: 


vm Lesen Sie noch einmal die formalen Merkmale von Bildern (S.39f.). Suchen Sie ein 
Bild, einen Bildausschnitt, Foto o.ä. zu einem auf Seite 40 genannten Thema und 

überlegen Sie ebenfalls, wie Sie das Bild in einem IKT einsetzen würden. Laden 
Sie Ihr Bild und Ihre Ideen ins „Forum Produktive Irritationen“ hoch, schauen Sie sich 
auch die Beiträge der Anderen an und kommentieren Sie! 


Mit dieser Aufgabe sollten u.a. folgende Kompetenzen ausgebildet oder er- 
weitert werden: 


22 © Frank & Timme Verlag für wissenschaftliche Literatur 


Motivation statt Isolation - Evaluation der digitalen Lehrkrafteausbildung 


« Bildkompetenz (Formalia zu Auswahl und Rezeption von Bildern). 

e Methodenkompetenz (Bilder mit dem Auftrag, zu „irritieren‘, recher- 
chieren, die außerdem frei abrufbar sind (z.B. auf Pixabay oder eigene 
Fotos) und zuvor präsentierten formalen Merkmalen entsprechen. 

+ Lehrkompetenzen: Didaktik/Methodik: Wie könnte man das Bild in 
einem interkulturellen Training in welchem Themenbereich einset- 
zen? 

e Evaluation: Bewertung der Bilderauswahl und didaktischen Uberle- 
gungen der KommilitonInnen. 


Im Folgenden ein Beispiel aus dem Forum mit einer Reaktion zu einem Bild- 
vorschlag‘: 


TN 1: Ich würde das folgende Bild als Einstieg in eine Stunde zum Thema 
„Feminismus weltweit‘, bzw. „Rollenbilder‘, nutzen. 


Quelle: https://pixabay.com/de/photos/feministinnen-m%C3%A 4rz-protest-frauen-4700823/, 
Original in Farbe, 03.10.2020) 


6 Es handelt sich dabei um eine wörtliche, anonymisierte Übernahme aus dem Forum, die nicht 
korrigiert wurde. 
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Zunächst würde ich die TN das Foto objektiv beschreiben lassen (z.B. nur Frau- 
en, alle mit ähnlicher Kleidung, mit erhobener Faust, rufend). Dann würde ich 
auf die Details eingehen lassen (z.B. alle ähnliche Kleidung). Falls den TN die 
Bedeutung noch nicht bekannt ist, würde ich Hypothesen aufstellen lassen, wofür 
beispielsweise das Stirnband und das Halstuch stehen könnte. Dann könnte man 
sich immer mehr vom Foto an sich entfernen und mehr auf damit zusammen- 
hängende Aspekte kommen, - je nach Interessen und eigenen Erfahrungen der 
TN. So könnte man z.B. überleiten zu Machtverhältnissen zwischen Männern 
und Frauen in den unterschiedlichen Herkunftsländern, Ungleichheit und Ge- 
walt gegenüber Frauen, aber auch (aktiver) Protest (es gibt ja viele Formen des 
Protests, also auch Alternativen zu „klassischen“ Demos). 


TN2: RE: Danke [...] für dein Bild! Ich kann mir schon vorstellen, dass dein Bild 
im Unterricht eine spannende Diskussion aufwerfen würde. Da das Bild eine sehr 
starke Botschaft ausübt (mit schwarzen Kleidungen hätte ich beinah geraten, es 
handelt sich um eine Demo von AfD in Leipzig, weil ich sie unglücklicherweise 
einmal zufällig miterlebte ...), finde ich dein sensibles Vorgehen zum Thema 
recht angemessen. Ich stimme dir zu, dass es ein emotionales Thema und manche 
Frauen einfach nicht auf einmal ihren Herz öffnen. Im Skript Seite 30 steht es zum 
Thema Heirat, dass es für muslimen Frauen sogar ein Tabu ist, über Ehemann 
mit Bekannten zu sprechen. 

Da es sich um ein für die TN heikles und u.U. auch emotionales Thema handeln 
kann, sollte man dabei die Fragen zunächst möglichst allgemein stellen und insge- 
samt äußerst sensibel vorgehen und z.B. die Fragen an die jeweiligen Reaktionen 
der TN im Verlauf anpassen etc. 


TN3: RE: Das Foto hat im wahrsten Sinne des Wortes Kraft! Vielen Dank! 

Es gibt einen tollen Bildband einer rumänischen Fotografin „The Atlas of Beauty“. 
Sie fotografiert Frauen auf der ganzen Welt und es geht weniger um tatsächliche 
Schönheit, sondern Frauen auf der ganzen Welt bekommen ein Gesicht. Hier die 
Homepage https://theatlasofbeauty.com/ (Ich persönlich folge ihr schon sehr lange 
auf Facebook und Instagram). 
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Die Reaktionen zeigen, welche Position das Mitteilen von eigenen Erfahrungen 
einnimmt. Außerdem wird die Rezeption des Bildes in Ländern angesprochen, 
in denen feministische Proteste ein Tabuthema sein können, was eine direk- 
te Bezugnahme auf den theoretischen Input des Skripts darstellt. Durch die 
Verknüpfung der Theorie mit den eigenen Erfahrungen werden Empathiefä- 
higkeit und eine realistische Selbsteinschätzung gefördert, zwei Aspekte, die 
in der interkulturellen Bildung von zentraler Bedeutung sind (vgl. dazu das 
Fünf-Schubladen-Modell interkultureller Kompetenz von Leenen 2019: 143f.). 
Eher lange, reflektierte Beiträge wie diese waren symptomatisch für die Dis- 
kussionen in den Foren, kürzere Reaktionen waren eher selten. 

Auf Inhalte und weitere Fragen wurde dann in den wöchentlichen MS 
Teams-Besprechungen eingegangen, außerdem wurden besonders gelungene 
Ergebnisse aus der Recherche oder spannende Diskussionen durch die Leh- 
renden aufgegriffen und direktes Feedback gegeben. Weiteres Feedback zu den 
Leistungen wurde schriftlich in den Foren direkt oder per E-Mail gegeben. 

Ein weiterer Baustein im ICM waren Erklärvideos (vgl. Bühner & Som- 
mer 2020: 130), die aus zeitlichen Gründen erst im Laufe des Semesters er- 
gänzt wurden. Eingeleitet wurden die Seminare durch Einführungsvideos, in 
denen Lernziele und Aufbau der Seminare erklärt wurden. Weitere Videos 
behandelten weniger konkreten Input, sondern fokussierten den Aufbau der 
Studienleistungen (im obigen Falle die Vorgaben zur Konzeption eines eige- 
nen interkulturellen Trainings). Diese wurden zum einen durch das Screen- 
cast Programm Panopto, im weiteren Verlauf aber mit Hilfe des webbasierten 
Video Tool Powtoon erstellt, das eine große Bandbreite an Gestaltungsmög- 
lichkeiten z.B. Animationen und Musik bietet. Weitere Erklärvideos wurden 
durch zusätzliche Hilfskräfte erstellt; die Themen waren u.a. eine Reihe zum 
wissenschaftlichen Schreiben (Recherche - Strukturieren und Roter Faden - 
Themenfindung - Richtiges Zitieren).’ 

Die obigen Ausführungen geben einen Eindruck über den Aufbau lediglich 
eines Seminars in der ICM. Es steht aber exemplarisch für den Aufbau aller 


7 Für das Wintersemester 2020/2021 werden ebenfalls Erklärvideos als Unterstützung zur Be- 
treuung der StudienanfängerInnen und in der Vermittlung des eigentlichen Seminarinhaltes 
integriert. 
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Seminare der Kategorie b. Im Hinblick auf das ebenfalls digital stattfindende 
Wintersemester 2020/2021 und zur Qualitatssicherung der konzipierten vir- 
tuellen Lernszenarien wurde eine Evaluation der Umsetzung notwendig, die 
sich nicht auf einzelne Seminare, sondern auf das komplette Studienangebot 
des Masters DaF/DaZ bezog. Der Aufbau und relevante Ausziige aus den Er- 
gebnissen werden im nachfolgenden Kapitel vorgestellt. 


2 Evaluation der digitalen Lehre 
im Sommersemester 2020 


Die Studie zur Evaluation des digitalen Semesters im Masterstudiengang DaF/ 
DaZ setzte sich aus einem qualitativen Erfahrungsaustausch und einer quan- 
titativen Online-Umfrage zusammen. Die Zielgruppe waren die Studierenden 
aller Fachsemesters des Masterstudiengangs DaF/DaZ. In der Vorstudie wurden 
allgemeine Erfahrungen zu den beiden in Kapitel 1 beschriebenen Formen der 
virtuellen Lehre bzw. zu den verschiedenen didaktischen Ansatzen (a und b) 
erfragt, die als freie Kommentare, anonym und online über das digitale Pinn- 
wand Tool Padlet verfasst werden konnten. Als Beispiele seien hier nur ein 
paar Aussagen aufgeführt, die zeigen, wie heterogen das Semester empfunden 
wurde, und die eine Quantifizierung durch eine nachfolgende Online-Umfrage 
notwendig machten: 


1. Ich finde das Onlinesemester nicht schlecht. Ich habe das Gefiihl in 
DaF genau so viel zu lernen wie in Präsenzsitzungen. In anderen 
Studiengdngen ist das leider nicht der Fall. Es wurde sich wirklich die 
Mühe gemacht, alles anzubieten, was möglich war, und das funktio- 
niert auch wirklich gut. Manchmal treten zwar technische Probleme 
auf, aber genau so kann auch mal die Straßenbahn liegen bleiben. Ich 
beteilige mich genau so wie in Präsenz. 

2. Mir persönlich fällt es schwer zuhause in den Arbeitsmodus zu kom- 
men. Nichtsdestotrotz finde ich die Alternative mit dem Forum in 
Moodle gut, da hier jeder zu Wort kommen kann und niemand auf- 
grund evtl. Schüchternheit stumm bleibt. Die Diskussionen in dem 
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Forum befürworte ich somit. Allerdings bin ich kein Fan von Aufga- 
ben, wo wir nur etwas zusammenfassen sollen. Hierbei ist bei mir der 
Lerneffekt eher gering, bzw. ist es eher eine zeitliche Beschäftigung. 
Ich kann verstehen, dass es Aufgaben geben muss, vor allem wenn 
Präsenz nicht verlangt ist, aber hierbei vielleicht mehr Forumsarbeit 
und weniger Zusammenfassen etc. 

3. Wenn unsere Dozentinnen wie in diesem Semester immer online er- 
reichbar und ansprechbar sind, kann ich mir das digitale Winterse- 
mester vorstellen. Es fehlt mir nur der live Input [...]. 

4. Wie ich schon erwähnt habe, benehme ich mich ziemlich zurückhal- 
tend und schüchtern im Unterricht, weil ich wahrscheinlich etwas 
unsicher mit der Sprache bin und habe Angst, Fehler zu machen. Bei 
der digitalen Form mache ich auch bestimmt noch viele schriftliche 
Fehler. Trotzdem bei Forumbeiträge habe ich die Möglichkeit, mehr 
Zeit nachzudenken und habe den Eindruck, dass ich meine Gedanken 
besser formulieren kann. 


Überraschend war Aussage 1, die keinen Unterschied in dem Erreichen der 
Lernziele zwischen Präsenz- und Online-Lehre feststellen konnte, was auch in 
der dritten Aussage anklingt, allerdings mit dem Hinweis auf die Erreichbarkeit 
der Lehrenden und dem Fehlen des Live-Inputs. Aussage 2 erwähnt gleich 
mehrere Aspekte, wie die fehlende Selbstlernkompetenz, die positiven Erfah- 
rungen mit den Forendiskussionen, die dazu noch für introvertierte Lernende 
neue Chancen der Partizipation biete, was sich mit dem Inhalt der vierten 
Aussage deckt. Kritik wird an Aufgaben zur Zusammenfassung einschlägiger 
Forschungsbeiträge geäußert.’ 

Diese Aussagen waren u.a. die Basis für eine quantitative Online-Umfrage, 
die nach Ende der Vorlesungszeit (14.07.-24.07.2020) durchgeführt wurde. Es 
nahmen insgesamt 46 Studierende aus allen Fachsemestern teil; es konnten alle 
ausgewertet werden, wobei nicht alle Studierenden noch aktiv an Seminaren 
teilnahmen, weshalb der Gesamterhebungsumfang je nach Frage schwankt. 
Sowohl die Erarbeitung als auch die Erfassung und Auswertung der Daten 


8 Diese stellten neben der Recherche und Didaktisierung eine weitere Aufgabenform dar. 


© Frank & Timme Verlag für wissenschaftliche Literatur 27 


Christina Maria Ersch 


erfolgte über die Umfrage-Software Evasys’, die besonders für Evaluation von 
Lehre und Seminaren geeignet ist und u.a. von vielen Universitäten genutzt 
wird (u.a. Johannes Gutenberg-Universität Mainz, Universität Bamberg, Uni- 
versität Flensburg). Die Umfrage erfasste keine Angaben zur Person, um die 
Anonymität in einem überschaubaren Studiengang (ca. 80 Studierende) so 
weit wie möglich zu gewährleisten. Lediglich die Unterscheidung zwischen 
den Doppelstudierenden (DS), also den Studierenden, die neben dem Master 
DaF/DaZ z.B. noch einen weiteren Master studieren, und den reinen DaF/ 
DaZ-Studierenden (im Folgenden als Einfachstudierende (ES) bezeichnet) 
wurde erfragt. Dadurch sollte eine Differenzierung zu Erfahrungen in ande- 
ren Studiengängen und vor allem die Angaben zum Workload der einzelnen 
Seminare gewährleistet werden. 

Die Studierenden wurden zu den o.a. Aspekten befragt, wobei die Stich- 
probe aus aktiv Studierenden aus dem 2. und 4. Semester als auch aus Studie- 
renden bestand, die zwar nicht mehr an allen Seminaren teilgenommen haben, 
aber durch die Arbeit an der Masterarbeit oder an anderen Studienleistungen 
ebenso von der veränderten Studiensituation betroffen waren. 

Die Umfrage enthielt positive, aber auch teilweise negative Aussagen, die 
mit Hilfe von Likert Skalen bewertet wurden. Es wurde bei der Erstellung 
des Fragebogens vornehmlich eine gerade Anzahl von Antwortmöglichkeiten 
gewählt (sechs Stufen), bei Aussagen, die den Vergleich betrafen, wurden 5-stu- 
fige Antwortmöglichkeiten gewählt, damit eine Stagnation ebenfalls abgebildet 
werden konnte. Die Arbeit mit Likert Skalen ermöglichte eine schnelle Beant- 
wortungszeit von 10-12 Minuten. Ebenso wurden zu verschiedenen Aspekten 
freie Kommentare ermöglicht, die sich im Nachhinein als sehr aufschlussreich 
herausstellten und in diesem Beitrag ebenso auszugsweise in der Analyse der 
Ergebnisse inkludiert werden. 

Das Ziel der Umfrage war, ein Meinungsbild zur Umsetzung der digitalen 
Lehre mit Fokus auf folgenden Aspekten einzuholen: 


1. Allgemeine Zufriedenheit mit der digitalen Lehre 
2. Zuwachs allgemeiner Kompetenzen inkl. digitaler Kompetenzen 


9 Informationen zur Software unter: https://www.evasys.de/evasys.html, 28.07.2020. 
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Kompetenzerwerb durch Referate 

Rezeption der neu gestalteten Erklärvideos 

Austausch und Diskussionen in den Foren 

Bewertung der technischen Gestaltung der Lehre (beide Konzepte) 
Bewertung der Seminare der Dozentinnen 

Persönlicher Kontakt zu KommilitonInnen und Dozentinnen 


SOOO SS ON Gr u 


Zufriedenheit mit der Erreichbarkeit bzw. der Betreuungssituation 


durch die Dozentinnen. 


Im Folgenden wird auf die wichtigsten Ergebnisse dieser Umfrage eingegan- 
gen; Aspekte 3 und 7 werden nicht weiter erlautert, da sie sehr ortsbezogen bzw. 
studienfachbezogen sind und sich daher nicht generalisieren lassen. 


2.1 Allgemeine Zufriedenheit mit der digitalen Lehre 


Zu Beginn wurde die allgemeine Zufriedenheit mit der digitalen Lehre in Ab- 
grenzung zur Zufriedenheit der digitalen Lehre im Masterstudiengang DaF/ 
DaZ bewertet: 


Wie zufrieden sind Sie allgemein mit der digitalen Lehre im Sommersemes- 
ter 2020? (n= 46) 


15,2% 21,7% 28,3% 19,6% 15,2% 0% 


sehr zufrieden überhaupt nicht 
zufrieden 


Wie zufrieden sind Sie allgemein mit der digitalen Lehre im Masterstudien- 
gang DaF/DaZ?" (n=46) 


10 Aus ökonomischen Gründen wurde die Bezeichnung des Studiengangs abgekürzt. 


© Frank & Timme Verlag für wissenschaftliche Literatur 29 


Christina Maria Ersch 


50% 23,9% 21,7% 4,3% 0% 0% 


sehr zufrieden überhaupt nicht 
zufrieden 


Festzuhalten ist hier, dass die allgemeine Zufriedenheit mit der digitalen 
Lehre geringer ist (bei einem Mittelwert von 3) als bei der digitalen Lehre 
im Masterstudiengang (Mittelwert 1,8). Allerdings ist die Streuung breit. 
Der Unterschied bei den DS, denen man durch ihre Erfahrungen mit einem 
zweiten Fach einen Vergleich zu diesem eher nachsagen kann, fällt mit den 
Mittelwerten 3,2 zu 1,6 noch deutlicher aus. In einem freien Kommentar 
wird das verdeutlicht: 


Im Vergleich zu den M.[...] Seminaren empfand ich das digitale DaF-Stu- 
dium als gut strukturiert und sehr lehrreich. [...] Insgesamt habe ich 
mich in diesem Studiengang weniger alleingelassen gefühlt wie in anderen 
M.[...]. Veranstaltungen. 


Dies bestätigt die positiven Erfahrungen, die in der Vorstudie schon deutlich 
wurden; das Thema Isolation bzw. im Umkehrschluss die vermehrte Erreich- 
barkeit wurde von den Studierenden unabhängig voneinander mehrfach er- 
wähnt, ist demnach also etwas, was zur positiven Evaluation bzw. einer posi- 
tiven digitalen Lernumgebung beitragen kann. 


2.2 Zuwachs allgemeiner Kompetenzen 


Auf Basis der Aussagen in der Vorstudie wurde nach der persönlichen Ein- 
schätzung über den Zuwachs einzelner Kompetenzen gefragt: Recherchekom- 
petenz, Schreibkompetenz (bzw. Mediation: schriftliches Zusammenfassen) 
und digitale Kompetenz. 

Wie zu erwarten, wurde der Zuwachs an digitaler Kompetenz am stärksten 
eingeschätzt: 
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Ich habe meine digitale Kompetenz erweitert. (n=46) 


52,2% 37% 87% 2,2% 0% 0% 


absolut zutreffend überhaupt nicht 
zutreffend 


Mit einem Mittelwert von 1,6 ist das Gefühl, mit Digitalem besser umgehen zu 
können, deutlich erkennbar. Hierbei gibt es keine nennenswerten Unterschiede 
zwischen beiden Gruppen. Als Ergänzung wird hier eine Einschätzung einer 
Studentin mit offensichtlicher Unterrichtserfahrung ergänzt, die sich sicherlich 
sowohl auf Lernende, als auch auf viele Lehrende übertragen lässt: 


Vor Corona hatte ich mich ein wenig gegen digitales Unterrichten gewehrt. 
Jetzt musste ich mich damit auseinandersetzen und kann dem Ganzen 
doch etwas Positives abgewinnen. 


Dies ist m.E. einer der positivsten Effekte des Lockdowns, der hoffentlich ei- 
nen Wandel hin zu einer schnelleren und flächendeckenden Digitalisierung 
führt. Dies bleibt jedoch abzuwarten und wird an dieser Stelle nicht weiter 
ausgeführt. 

Bei der Erweiterung der Recherchekompetenzen und der Schreibkompe- 
tenz in Bezug auf schriftliche Zusammenfassungen zeigt sich ein eher unein- 
heitliches Bild: 


Ich habe meine Recherchekompetenz (d.h. Internetrecherche, Literatur- 
recherche) verbessert. (n=46) 


23,9% 23,9% 26,1% 8,7% 10,9% 6,5% 


absolut zutreffend überhaupt nicht 
zutreffend 
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Doppelstudierende bewerten den Zuwachs dieser Kompetenz mit einem Mit- 
telwert von 3,1 (und einer Standardabweichung von 1,5) etwas geringer als die 
reinen DaF-Studierenden (Mittelwert 2,5, Standardabweichung ebenfalls 1,5). 

Eine Evaluation dieser Kompetenz wurde gezielt gefragt, da die Recher- 
chekompetenz und im speziellen die Internetrecherche durch die zeitweilige 
Schließung der Präsenzbibliotheken zwangsweise ausgeweitet werden musste. 
Im ICM gab es darüber hinaus einige Aufgaben, in denen gezielt z.B. Bilder 
(s. Kapitel 1.3) oder weiterführende Literatur gesucht werden sollte, die es in 
der „herkömmlichen“ Variante in dieser Form nicht gab. 

Ebenso wurde nach der schriftlichen Zusammenfassung gefragt, da dies 
auch eine Aufgabenform darstellte, um die Inhalte des Skripts zu vertiefen 
bzw. um Abstracts zu verfassen. Ferner wurde die Zusammenfassung mehr- 
fach in der Vorstudie erwähnt, weshalb auch dies quantifiziert werde musste. 
Die durch die Vorstudie eher kritischen Aussagen bezüglich dieser Aufgaben 
konnte die Online-Umfrage nicht zu 100% verifizieren: 


Ich habe die Kompetenz des schriftlichen Zusammenfassens in diesem Se- 
mester verbessert. (n=46) 


17,4% 32,6% 23,9% 10,9% 6,5% 8,7% 


absolut zutreffend überhaupt nicht 
zutreffend 


In den Kommentaren wurden Zusammenfassungen dreimal als positiver und 
gewinnbringender Aufgabentyp erwähnt. 

Daraus resultiert zum einen, dass das Lernziel dieser Aufgabe noch deutli- 
cher gemacht werden muss, damit klar wird, dass diese Aufgabe nicht nur dazu 
dient, den Workload zu füllen, sondern dass dies eine Kompetenz ist, die für 
das wissenschaftliche Arbeiten nötig ist und zu den Kompetenzen gehört, die 
Studierende im Laufe ihres Studiums erwerben müssen. Bei der Konzeption 
von Aufgaben für die ICM sollte aber zum anderen darauf geachtet werden, 
wie zielführend die Zusammenfassungsaufgaben für bestimmte Inhalte sind 
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und sie méglichst mit anderen Aufgabenformen abzuwechseln, damit diese 
nicht demotivierend wirken. 

Neben den ausgewahlten Kompetenzen wurde an dieser Stelle auch die 
Einschatzung tiber das Verhaltnis zum allgemeinen Lerneffekt im Vergleich 
zum Präsenzseminar thematisiert. Ausschlaggebend waren folgende, eher 
überraschende Aussagen aus der Vorstudie: 


e Soweit ich hier und von anderen Kommilitonen erfahren habe, konnten 
sie miteinander vielmehr kommunizieren und Meinungen austauschen 
und dadurch noch effektiver lernen als in Präsenz-Veranstaltungen. 

« Für das erste rein digitale Semester habe ich relativ gute Lernerfahrun- 
gen machen können. Ich habe mich viel mehr aktiv mit den Inhalten 
auseinandergesetzt. [...] Vor allem die (persönlichen) Beiträge in den 
Diskussionen haben viel bei mir angeregt und einen zusätzlichen Ler- 
neffekt gehabt, da ich selbst auch erst einmal Zeit brauche, um meine 
Meinung mitzuteilen und im Seminar deshalb oft ruhiger bin. 


Hieraus ergab sich die Hypothese, dass das digitale Semester dazu führt, sich 
intensiver mit den Inhalten auseinanderzusetzen und dadurch einen stärke- 
ren Lerneffekt zu erzeugen. Diese würde allen Annahmen und Bedenken, die 
gegenüber dem digitalen Lernen angebracht werden (vgl. dazu das Vorwort 
zur 1. Auflage und die Hinweise zu den zwei weiteren Auflagen von Handke 
2020: 3ff.), endgültig widersprechen. 

Dieser Effekt konnte ebenfalls nicht eindeutig verifiziert werden: 


Ich habe das Gefühl, durch die virtuelle Lehre im Sommersemester 2020 
mehr gelernt zu haben, als ich es in regulären Präsenzseminaren getan hätte. 
(n=44) 


31,8% 11,4% 22,7% 6,8% 9,1% 18,2% 


absolut zutreffend überhaupt nicht 
zutreffend 
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Es zeigt eine starke Abweichung (von 1,9) und dadurch ein heterogenes 
Bild. Doppelstudierende können dieses Gefühl noch weniger bestätigen als 
die reinen DaF-Studierenden. 


2.3 Evaluation der Erklarvideos 


Bei der Auswertung der Ergebnisse in Bezug auf die Integration von Erklarvi- 
deos kann zwischen der reinen Rezeption und der eigenen Produktion unter- 
schieden werden. Hierbei gab es keine signifikanten Unterschiede der beiden 
Gruppen, weshalb diese nicht separat beschrieben werden. 

Erstere zeigte, dass die Rezeption der Videos von 67,7% (n= 31, mw 1,4, 
Std. Abw. 0,7) der Studierenden als absolut hilfreich und von 50 % (n=32, mw 
1,7, Std.Abw. 0.8) als absolut motivierend bewertet wurden. Ebenso stark ist 
der Wunsch nach mehr Erklarvideos zu allgemeinen Themen wie Studienor- 
ganisation (wie sie vornehmlich im Sommersemester erstellt wurden), aber 
auch zur inhaltlichen Unterstützung innerhalb eines Seminars. 

Zugleich wurde die Produktion von eigenen Videos positiv evaluiert. Die 
Studierenden konnten in einigen Seminaren wahlen, ob sie als Studienleistung 
ein Referat halten oder ein Erklärvideo erstellen. Bemerkenswert waren die 
Einschätzungen, das eigene Fachwissen, die Präsentationskompetenz und vor 
allem die digitale Kompetenz durch die Produktion eigener Videos erweitern 
zu können. Interessant ist dabei die Korrelation der Studierenden, die sowohl 
ein Referat gehalten als auch ein Video produziert haben. 


Ich habe mein Fachwissen durch die Produktion von Erklärvideos erweitern 
können (n=19): 


42,1% 47,4% 10,5% 0% 0% 0% 


absolut zutreffend überhaupt nicht 
zutreffend 


Im Vergleich dazu lässt sich dieser Trend bei den Referaten nicht erkennen: 
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Ich habe mein Fachwissen durch mein Referat/meine Referate erweitern 
können (n=29) 


24,1% 20,7% 27,6% 6,9% 13,8% 6,9% 


absolut zutreffend überhaupt nicht 
zutreffend 


Allerdings haben nur insgesamt vier Studierende beide Studienleistungen er- 
bracht, weshalb in diese Richtung noch weitere Befragungen notwendig sind. 
Doch auch diese vier geben an, deutlich mehr durch die Erklärvideos als durch 
Referate gelernt zu haben. 

Sicher fehlt die Moderationskompetenz, die eher durch Präsentationen 
erworben werden kann, aber für die Verinnerlichung und die Fähigkeit, In- 
halte ansprechend und anschaulich präsentieren zu können, ist die Produktion 
dieser Videoform auch außerhalb von Corona sinnvoll (vgl. dazu die Ausfüh- 
rungen von Maxin 2018: 619 zu Videos als Unterrichtsmethode). Dies betrifft 
auch die noch eher weniger häufig untersuchte Erklärkompetenz als Teil der 
professionellen Handlungskompetenz von Lehrenden (vgl. Ernst 2017: 158), 
die definiert werden kann „als die Fähigkeit, die spezifischen Anforderungen, 
kommunikative Aufgaben und Probleme, die sich in der Erklärinteraktion 
stellen, zu bewältigen“ (ebd.: 161, vgl. dazu auch die Definition von „Erklären“ 
im schulischen Kontext von Maxin 2018: 613f.). Ebenso der Zuwachs dieser 
wurde durch die Videografie als gegeben bewertet. 

Sind die Ergebnisse der Umfrage ansonsten eher heterogen, lässt sich zu- 
sammenfassend sagen, dass die Evaluation der Erklärvideos auf allen Ebenen 
sehr positiv ausfällt und die Integration von Videos auf alle Fälle weiter vertieft 
werden sollte. Kritisiert wurde lediglich der erschwerte Zugang zu Beginn des 
Semesters (aus Kapazitätsgründen können Videos nicht auf den Servern der 
Lernplattform hochgeladen werden), der aber durch einen zentralen Ordner 
auf der Sync-and-Share-Plattform Seafile, zu dem alle Studierenden Zugang 
haben, verbessert wurde. Dies bedeutete allerdings ein weiteres Programm; 
wünschenswerter wäre eine Integration der Videos in bereits bekannte Tools 
(evtl. auch über Youtube). 
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Ferner spielten die Diskussionen in den Foren auf der Lernplattform eine 
wichtige Rolle bei der digitalen Lehre, weshalb im folgenden Kapitel näher 
darauf eingegangen wird. 


2.4 Austausch und Diskussionen in den Foren 


Gerade die Forenbeiträge wurden in der Vorstudie sehr häufig bewertet, der 
Tenor dabei war eher positiv, allerdings wurden die Länge und die Masse der 
zu lesenden und kommentierenden Beiträge kritischer gesehen. Die Ergebnisse 
der Umfrage zeigen allerdings, dass das Lesen der Forenbeiträge als hilfreich 
erachtet wurde (beide Gruppen). Erstaunlich sind die Ergebnisse, die die Tat- 
sache verifizieren, dass sich Studierende im Forum stärker beteiligen als sie es 
in Präsenzsitzungen tun würden: 


Ich habe mich in den Foren durch das Schreiben von Beiträgen intensiver 
zu Wort gemeldet als in den Präsenzsitzungen. (n=28) 


60,7% 17,9% 7,1% 7,1% 3,6% 3,6% 


absolut zutreffend überhaupt nicht 
zutreffend 


Dieser Eindruck ist sowohl bei den ES als auch bei den DS erkennbar. Die er- 
schwerte Kommunikation bei den virtuellen Präsenzsitzungen konnte darüber 
hinaus durch die Forenarbeit entlastet werden, was in folgender Aussage aus 
der Vorstudie deutlich wird: 


Der Austausch in den Seminaren empfand ich schwieriger, da man nicht 
sehen konnte, wer auch etwas beitragen möchte und das ist bei einer 
Präsenzsitzung einfach anders. Es war manchmal schwierig zu Wort zu 
kommen. Aber dennoch wurde das Semester von Ihnen gut gemeistert 
und man hat viel mitgenommen. Besonders die Forenbeiträge fand ich 
sehr bereichernd; ich hätte sonst nicht so viel dazu beitragen können. 
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Allerdings müssen klarere Regularitäten bezüglich der Beiträge vorab festgelegt 
werden. In den freien Kommentaren werden u.a. folgende Aspekte erwähnt: 


e Mehr Zeit für Kommentare 


Vorgaben über Länge der Beiträge z.B. durch Zeilenbegrenzung 
e Redundanz vermeiden 
e Moderation durch die Lehrenden. 


Als weiteres Zwischenfazit lässt sich festhalten, dass durch den Moduswech- 
sel von der Mündlichkeit zur Schriftlichkeit, den digitale Lehre insbesondere 
durch die ICM bietet, sich eine vielversprechende Möglichkeit ergibt, auch 
weniger kommunikativen Lernenden eine Chance zur Beteiligung zu geben 
und dadurch eine Erhöhung des Lerneffekts zu ermöglichen. 

Als letzter, jedoch nicht unerheblicher Bereich erfolgen im nächsten Kapitel 
die Ausführungen bezüglich der Maßnahmen, die eine soziale Isolation, auch 
digitale Distanz genannt, ausgleichen sollten. 


2.5 Maßnahmen gegen die sog. digitale Distanz 


Verschiedene Maßnahmen bzw. Aktivitäten und Funktionen von Tools wur- 
den eingesetzt, um die soziale Isolation der Studierenden durch die fehlenden 
realen Treffen zumindest abzuschwächen. Diese waren u.a. die Bedeutung der 
eingeschalteten Kamera während der Präsenzsitzungen (sowohl in Modell a 
als auch in b), die Integration der Chatfunktionen über MS Teams (bei Mo- 
dell b) und der dadurch vermehrten Erreichbarkeit der Lehrenden. Überdies 
gibt die Häufigkeit der Teilnahme an Präsenzsitzungen Aufschluss darüber, als 
wie wertvoll diese angesehen werden. Dies wird durch den Fakt, dass die An- 
wesenheitspflicht ausgesetzt wurde, noch verstärkt. Beginnend bei Letzterem 
lässt sich festhalten, dass, obwohl in der ICM während der Videobesprechun- 
gen mit MS Teams keine relevanten Inhalte vermittelt wurden, die Anzahl der 
Teilnehmenden bis zum Ende des Semesters durchschnittlich bei ca. 75% lag. 
Außerdem wurden diese Besprechungen als weniger ermüdend empfunden 
als die 90 Minuten virtuelle Präsenzseminar aus Modell b: 
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Ich empfand die regelmäßigen Sitzungen mit Zoom als zu ermüdend und 
habe nach kurzer Zeit mental abgeschaltet. (n=28)" 


25% 25% 17,9% 17,9% 14,3% 0% 


absolut zutreffend überhaupt nicht 
zutreffend 


Der Effekt ist bei den DS, die vermutlich noch mehr Videobesprechungen 
erlebt haben, mit einem Mittelwert von 2,9 zu 2,5 bei den ES noch ein wenig 
stärker. Dies deckt sich auch mit der allgemeinen „Zoom Fatigue“, die vor 
allem dann auftritt, wenn nur über Fachliches gesprochen wird und man sich 
zur Teilnahme an diesen Sitzungen verpflichtet fühlt (vgl. den Zeitungsartikel 
von Peter Ilg vom 16.09.2020). Für das Seminar zu Interkulturalität, bei dem 
die virtuellen Sitzungen „nur“ zum Austausch und häufig auch zum Plaudern 
genutzt wurden, zeigt sich dadurch ein deutlich anderes Bild: 


Ich empfand die Besprechungen in Teams als zu ermüdend und habe nach 
kurzer Zeit mental abgeschaltet. (n=21) 


0% 9,5% 4,8% 14,3% 33,3% 38,1% 


absolut zutreffend überhaupt nicht 
zutreffend 


Dies spricht für das Modell b, in dem Kontakt zu gleichgesinnten Kommi- 
litonInnen hergestellt und durch den ungezwungenen Kontext eine soziale 
Distanz abgebaut werden konnte. Generell wird die Kontaktaufnahme über 
MS Teams als sehr gewinnbringend bewertet. Die Studierenden geben an, sich 
neben eigenen Whatsapp Gruppen (66,7%) über den Chat (48,1%) und den Vi- 


11 Auf die Negativität dieser Aussage wurde in der Umfrage explizit hingewiesen, weshalb da- 
von ausgegangen werden kann, dass die Bewertungen bewusst gemacht wurden und damit 
aussagekräftig sind. 
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deoanruf (40,7%) tiber Teams mit Ihren KommilitonInnen auszutauschen. Bei 


der Kontaktaufnahme zu den Dozentinnen überwiegt dagegen die Vorliebe für 


den Chat via MS Teams gegenüber der eher üblichen Form per Email (n= 27): 


Telefon ("Klassisch") 0% 
Chat (z.B. Whatsapp) (_) 11.1% 
Anruf (z.B. Whatsapp) 0% 
ema) 37% 
Chat (Moodle) (__) 11.1% 
Chat (MS Teams) 85.2% 
Chat (während einer Zoom Sitzung) (__} 7.4% 
Videoanrut (MS Teams)? 104% 
Videoanruf (Skype) (__) 11.1% 
Videoanruf (Whatsapp) () 3.7% 
sonstige 0% 


Die Erreichbarkeit, die durch die Nutzung von MS Teams vereinfacht wird, 


wirkte sich ebenso positiv auf die Bewertung der Studierenden aus, was vor 


allem in Kommentaren zum Ausdruck kommt: 


« Die Erreichbarkeit von [...] war hervorragend. Fragen konnten viel 
unkomplizierter geklärt und Sprechstundentermine schneller orga- 
nisiert werden. Gerade weil im 4. DaF-Semester ja keine bzw. kaum 
Präsenzveranstaltungen stattfinden und man weniger Zeit an der Uni 
verbringt, eignet sich MS Teams super, um in Kontakt mit der Uni, Do- 
zentInnen und Studierenden zu bleiben. Ich würde mir wünschen, dass 
diese Möglichkeit auch über die Coronazeit hinaus bestehen bleibt. Vor 
allem im Hinblick auf die Masterarbeit wäre es toll, die DozentInnen 
weiterhin so unkompliziert zu erreichen und bei Fragen ansprechen 
zu können. 
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« Die vielen Möglichkeiten der digitalen Lehre und der Kontaktaufnahme 
sind teilweise eine Bereicherung, aber ersetzen aus meiner Sicht nicht 
ganz den persönlichen, auch informellen Kontakt. 


Zusammenfassend kann festgehalten werden, dass sich gerade mit MS Teams 
auf besonders einfache Weise ein virtueller Campus simulieren lässt und da- 
durch helfen kann, die digitale Distanz abzuschwächen: 


Durch die verschiedenen Funktionen von MS Teams wie Chatgruppen (z.B. 
Sprechstunden-Chat), die digitale Bibliothek, die Teams zu den einzelnen 
Seminaren usw. hatte ich das Gefühl, dass der Mangel an persönlichem Kon- 
takt ausgeglichen werden konnte (n=25) 


36% 28% 8% 4% 16% 8% 
trifft voll und ganz zu trifft Uberhaupt nicht 
zu 


Doch auch hierbei wird deutlich, dass die Erfahrungen nicht bei allen Stu- 
dierenden gleich waren und deshalb die Vielfalt der verschiedenen Kontakt- 
möglichkeiten angeboten werden muss. Auch der zeitliche Aufwand für die 
Vor- und Nachbereitung muss bei der Festlegung des Lehrhabitats berück- 
sichtigt werden. Ein Vorteil, den der Chat dagegen bietet, ist die vereinfachte 
Kommunikation „auf Augenhöhe‘; da sie eher der face-to-face Kommunikation 
ähnelt bzw. sich durch die sog. „Konzeptionelle Mündlichkeit“ (Albert 2013: 
166ff.) auszeichnet. Dies kann dabei helfen, die angemessene Kommunikati- 
onsform mit (Hochschul-)Lehrenden z.B. in Bezug auf E-Mails zu finden, die 
sowohl für ausländische als auch für inländische Studierenden immer noch 
eine Herausforderung darstellt (vgl. Hiller 2014). 


2.6 Zusammenfassender Vergleich der beiden Modelle 


Ein valider Vergleich der beiden Modelle ist anhand der erhobenen Daten 
nicht möglich; dazu bedarf es einer detaillierteren Evaluation aller Seminare. 
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Außerdem muss ebenfalls die Diversität der Lehrformen bzw. der Lehrpersön- 
lichkeiten beachtet werden. Nicht nur Studierende, sondern auch Lehrende 
haben ihre Vorlieben und ihren individuellen Lehrstil. 

Dennoch lässt sich aufgrund der genutzten Medien und Tools eine Tendenz 
erkennen. Durch die sehr positive Bewertung der Videos, der Forenarbeit auf 
der Lernplattform, der Nutzung von MS Teams und den dortigen Chat-Funk- 
tionen und der synchronen Erreichbarkeit wird klar, dass Modell b zumindest 
für den Großteil der Studierenden für die rein digitale Lehre praktikabler ist. 
In der Online-Umfrage wurde gezielt nach der Präferenz der Studierenden für 


das Wintersemester gefragt: 


Wenn Sie wählen könnten, für welche Form würden Sie sich entscheiden? 
(n=46) 


Virtuelle Seminarsitzungen mit Zoom OC) 8.5% 
Flipped Classroom: Skript+Moodle+Besprechungen in Teams (Cl) 48.9% 
Beide Formen parallel wie im Sommersemester 2020 Co) 14.9% 
Eine Mischform wie z.B. Zoom Sitzungen + Skript + Moode ( 27.7% 


Knapp die Hälfte der Studierenden wünscht sich das Modell b (hier als Flipped 
Classroom bezeichnet), nur gut 9% möchten ihre Seminare virtuell über Zoom, 
also Modell a, besuchen. Bezüglich dieser beiden Varianten gibt es bei den DS 
und den ES keine nennenswerten Unterschiede, lediglich wünschen sich mehr 
DS (n= 19) mit 42,1 % eine Mischform aus beiden Modellen. 

Bezieht man Kommentare aus der Vorstudie und aus der Online-Umfrage 
in die Ergebnisse der Frage nach der Aufmerksamkeitsspanne (Kapitel 2.6) mit 
ein, ist auch hier eine deutlich positive Bewertung der nichtfachlichen, eher 
lockeren Besprechungen auf Teams zu erkennen. Sicher ist der Wunsch nach 
herkömmlicher Präsenzlehre bei allen Studierenden (und bei Lehrenden) glei- 
chermafen stark, aber Modell b scheint die Chancen, die digitale Lehre bietet, 
zu nutzen. Ferner werden 90 Minuten Seminare, wie sie ja in vielen Fachberei- 
chen üblich sind, kritischer gesehen, d.h. die Studierenden reflektieren mehr 
über ihre eigenen Lehr- und Lernvorlieben, wie folgender Kommentar zeigt: 
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Mit der Herangehensweise dieses digitalen Semesters habe ich festgestellt, 
dass es bei mir viel effektiver wirkt, wenn ich den Skript, Videos, Artikel 
und Forumbeitrdge meiner Kommilitonen lesen und kommentieren muss 
als 90 Minuten im Unterricht sitzen und zuhören. 


Es zeigt wiederum, wie zentral die Individualisierung von Lehr-Lernprozessen 
in zeitgemäßer (nicht nur digitaler) Lehre ist und welche Bedeutung der soziale 
Austausch dabei einnimmt. Bei der didaktischen Umsetzung ist das ICM ein 
wichtiger Schritt: „Ihe Inverted Classroom Model is not only the backbone to 
modern teaching and learning formats on an academic level but also solves 
several problems of traditional teaching and learning“ (Handke & Weber 2018: 
131). Dies muss aber noch genauer und längerfristiger eruiert werden. 


3 Fazit und Ausblick 


Ausgangspunkt für diesen Beitrag war die Frage, auf welche Weise digitale Leh- 
re unter erschwerten Bedingungen dennoch lernzielférdernd und motivierend 
eingesetzt werden kann. Eine spezifisch auf das Fach adaptierte Form des ICM 
bietet dafür einen vielversprechenden Ansatz, mit dem im Masterstudiengang 
DaF/DaZ sehr positive Erfahrungen gemacht werden konnten. In Bezug auf 
die eingangs erwähnte Frage nach Mitteln, Prioritäten, Rolle der Lehrenden 
und Voraussetzungen kann folgendes festgestellt werden: 


e Skripte in der Kombination mit verschiedenen Aufgabenformen sind 
motivierend, praktikabel und können die Vermittlung der Lernin- 
halte, die sonst während Präsenzsitzungen erfolgt, ersetzen. Es muss 
dabei aber zwischen verschiedenen Aufgabentypen und Formen 
abgewechselt werden, ebenso müssen Lernziele wie z.B. bei Zusam- 
menfassungen deutlich formuliert werden. 

« Der Einsatz von Erklärvideos, sowohl rezeptiv als auch produktiv, 
trägt zur Motivation und zur Kompetenzentwicklung bei. 

e Forenarbeit aktiviert alle Lernenden, sogar diejenigen, die in Prä- 
senzseminaren eher zurückhaltender sind. 
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e Microsoft Teams bietet vielfältige Möglichkeiten zu Kommunikation 
in Echtzeit, die Simulation eines virtuellen Campus wird dadurch 
gegeben. 

e Synchrone Termine, die nicht für Seminarinhalte , sondern zum Aus- 
tausch genutzt werden, wirken der „Zoom-Fatigue“ entgegen und 
verringern das Gefühl der sozialen Isolation. 

« Eine vermehrte Erreichbarkeit der Lehrenden z.B. durch Chats be- 
wirkt ebenfalls, dass sich die Studierenden weniger allein gelassen 
fühlen. Die Kommunikation auf Augenhöhe verstärkt dies noch. 


Im weiteren Verlauf gilt es dennoch, die Erkenntnisse gerade bezüglich der 
digitalen Distanz noch weiter zu vertiefen. Dies betrifft vor allem: 


e die Erweiterung der Erklärvideos mit barrierefreiem Zugang z.B. 
über einen offenen Youtube-Kanal. 

e die Implementierung weiterer Interaktions-Tools wie gather.town 
zum Aufbau des „sozialen Dorfs“. 

« Erarbeitung einer erweiterten Feedback-Kultur, die für Lehrende 
zeitlich und organisatorisch händelbar ist und nicht auf Dauer zu 
einer Überbelastung und „ständigen“ Erreichbarkeit führt. 


Letztere ist aber für die Lehrenden ein erheblicher Mehraufwand, da diese 
intensive Betreuung, neben der Konzeption des Online-Unterrichts, sehr zeit- 
aufwändig ist. Handke & Weber (2018: 138) machen das auch noch einmal 
deutlich: „Die Rolle des Lernbegleiters im Hörsaal - seine Motivation, seine 
Kenntnisse und sein Geschick - sind nach unserer Einschätzung nach wie vor 
gefragt, in einem Inverted-Classroom-Szenario übrigens mehr denn je zuvor.“ 
Dies muss sich auch auf die finanziellen Lage auswirken: „Die Bundesländer, 
welche Regelungen zu digitaler Lehre berücksichtigen, sehen eine Anrechnung 
der Durchführung von EL-Angeboten und deren Betreuung auf das Lehrde- 
putat vor“ (Lungershausen, Emunds & Buß 2016: 102). Dies wird bis dato aber 
scheinbar nicht umgesetzt, obwohl Beispiele für entsprechende Modelle der 
Deputatsanrechnungen für Formen des digitalen Lernens bereits vorliegen 


© Frank & Timme Verlag für wissenschaftliche Literatur 43 


Christina Maria Ersch 


(vgl. ebd.). Eine Befragung der Lehrenden wäre also ebenfalls sinnvoll’, um 
mögliche Neuberechnungen zu fundieren und damit auch noch mehr Anreize 
zu schaffen, um weniger über die Machbarkeit von Präsenzterminen und den 
damit einhergehenden Hygienevorschriften zu diskutieren, sondern die aktu- 
ellen Chancen mehr dazu zu nutzen, sich auf neue Lernformate einzulassen. 
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Evaluation der unterschiedlichen 
virtuellen Sprachkursformen 


Einleitung 


Der Masterstudiengang Deutsch als Fremdsprache/Deutsch als Zweitsprache 
der Johannes Gutenberg- Universitat Mainz ist einer der wenigen Studien- 
gange, bei dem Lernende bzw. zukiinftige Lehrende ein Modul zur ,,Digitalen 
Lehre“ absolvieren. Dies mag der Grund für zahlreiche Anfragen zur Bera- 
tung im Bereich „Digitale Lehre“ zu Beginn der Corona-Krise gewesen sein. 
In diesem Zusammenhang gab es sowohl Anfragen der Volkshochschulen, 
des Goethe-Instituts und auch verschiedener weiterer Organisationen (u.a. 
bei der Tagung Fremdsprachenlernen im digitalen Zeitalter/Auswirkungen 
von Covid-19 auf das (Fremdsprachen)Lernen des Goethe-Institut Peking 
und dem Institut frangais im Rahmen des Deutsch-Französischen Kultur- 
fonds (Elysee-Fond), den „Jornadas Académicas“ in Pachuca, Mexiko, dem 
Fremdsprachenzentrum der Universität Passau und der GIP-Tagung der 
Pädagogischen Hochschule Freiburg: „Lehr-Lern-Medien für DaF aus nati- 
onaler und internationaler Perspektive“. Diese Panel-Diskussionen, Vorträge 
und Fortbildungen ließen erkennen, dass die Umsetzung der digitalen Lehre 
sehr unterschiedlich realisiert worden ist und waren Anlass für eine erste 
kleine Studie zur Akzeptanz der insgesamt fünf ausgemachten Formen des 
virtuellen Sprachunterrichts. Im Zentrum meiner Vorträge stand die Not- 
wendigkeit des Ausgleichs der sog. digitalen Distanz, die lediglich in einem 
Kursformat im Vordergrund steht. Überprüft wurde mit der kleinen Studie, 
inwieweit der Ausgleich der Distanz durch zahlreiche soziale und kollabo- 
rative Tools tatsächlich erfolgreicher ist als andere Formen des virtuellen 
Sprachunterrichts. 
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In einem ersten Kapitel wird knapp auf die Ausgangssituation vor Corona 
eingegangen. Es folgt im 2. Kapitel eine Thematisierung der sog. digitalen Dis- 
tanz, die es auszugleichen gilt (vgl. Studie Ersch 2020). Im 3. Kapitel werden 
die fünf unterschiedlichen Typen des virtuellen Unterrichts skizziert. Dabei 
wird auch ein kurzer Blick auf die genutzten Video-Chat Tools geworfen. Das 
4. Kapitel präsentiert die Ergebnisse der sehr kurzen Prästudie. Diese dient vor 
allem auch den Studierenden des Masterstudiengangs DaF/DaZ, die in diesem 
Bereich ihre Masterarbeiten verfassen. Hier werden spezifischere empirische 
Studien angefertigt, deren Ergebnisse dann einen zusätzlichen Erkenntnis- 
gewinn versprechen. 


1 Digitales Lernen vor Corona 


Die Analyse von Persike & Friedrich (2016) zum Stellenwert der digitalen 
Lehre in Deutschland im Auftrag des Hochschulforums Digitalisierung macht 
deutlich, dass digitale Medien an der Mehrzahl der Hochschulen kein integ- 
raler Bestandteil der Lehre sind. De Florio-Hansen (2018: 291) schrieb mit 
Bezug zum Fremdsprachenunterricht, dass gerade dieser Bereich sehr von der 
Digitalisierung profitieren kann. Wenn jedoch gerade an den Hochschulen 
der Umgang mit digitalen Medien als sehr gering eingestuft wird und darüber 
hinaus auch kein Bestandteil der Lehrendenausbildung ist, wie soll er dann an 
die Schulen oder Sprachschulen kommen? Wie eingangs dargestellt, ist das 
Modul zur „Digitalen Lehre“ im Masterstudium DaF/DaZ an der Universität 
Mainz fast ein Alleinstellungsmerkmal. Van Ackeren et al. (2019: 110) fassen 
den Stand der Digitalisierung zusammen: 


In seiner Zusammenschau kommt der Monitor Lehrerbildung in sei- 
ner 2018 vorgelegten Studie zu dem Schluss, dass insbesondere das 
Lehramtsstudium in den Bundesländern derzeit weit davon entfernt 
sei, Inhalte des Studiums zum Umgang mit digitalen Medien im Sinne 
der von der Kultusministerkonferenz angestrebten Ziele verbindlich 
festzuschreiben. 
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Aktuell fordern Lorenz & Endberg (2019: 62) die gezielte Nutzung digitaler 
Medien für das fachliche und überfachliche Lernen. Sie argumentieren eben- 
falls, dass die Nichtnutzung digitaler Tools in „hohem Masse an der fehlenden 
professionellen Handlungskompetenz der Lehrpersonen im Kontext der Digi- 
talisierung“ liegt. Dies wiederum liegt an den fehlenden Möglichkeiten, diese 
Kompetenzen in der Lehramtsausbildung zu erwerben (vgl. Eickelmann et al. 
2016; Schiefner-Rohrs 2018). 

Für den Bereich Sprachen bot gerade das Goethe-Institut zahlreiche Wei- 
terbildung für Lehrende an (z.B. das u.a. aufgeführte DIP in SOE - digital, 
interkulturell - projektorientiert in Süd-Ost-Europa). Auch auf der Plattform 
Dhoch3 des DAAD findet sich ein Modul zum digitalen Lernen (Modul 3: 
Lehren und Lernen mit elektronischen (Online-)Medien). 

Wie Grein & Strasser (2019) im Rahmen des Projekts DIP in SOE thematisie- 
ren, wurde im Bereich Sprachunterricht der sinnvolle Einsatz unterschiedlicher 
digitaler Tools auch im face-to-face-Unterricht hervorgehoben. Aufgegriffen 
wurden dort (2019: 17f.) verschiedene Educational Applications (EduApps), 
also eigens „für unterrichtliche Zwecke entwickelte browser-basierende Inter- 
nettools“ (Schmidt & Strasser 2016: 5). Aus fremdsprachendidaktischer Sicht 
basieren EduApps auf folgenden Prinzipien (vgl. Schmidt & Strasser 2016, zi- 
tiert in Grein & Strasser 2019): 


1. Reflexion: Brainstorming- bzw. Mindmapping-Anwendungen wie 
z.B. Edupad' oder Padlet” unterstützen die Lernenden bzw. Lehren- 
den in der Reflexion bestimmter Arbeitsprozesse (z.B. Feedback 
zur sprachlichen Performanz beim gemeinsamen Verfassen einer 
Abenteuergeschichte). 

2. Modifikation: Werkzeuge wie Quizlet* oder Kahoot‘ ermöglichen es 
digitale Lernprodukte (z.B. Flashcards) zu produzieren, um diese 
dann an ihre Lehr- und Lernbedürfnisse anzupassen. 


1  www.edupad.ch 
2  www.padlet.com 
3  www.quizlet.com 
4 


www.create.kahoot.com 
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3. Kommunikation: Mit Anwendungen wie Edupad°, Todaysmeet’, Tri- 
cider’ etc. findet Kommunikation über den Lernprozess zwischen 
den Lernenden statt. Heute bietet sich hier vor allem Gathertown® 
als sinnvolles Tool zur Kommunikation an. 

4. Multiplikation: Die Lernprodukte (z.B. Collage mit Padlet) können 
auf einfache Art und Weise mit Mitlernenden und der Lehrkraft 
geteilt werden. 

5. Kreation: Lernende und Lehrende können einfache Lern- und Un- 
terrichtsmaterialien selbst erstellen (z.B. Collagen mit Padlet, Voka- 
bellernkarteien mit Quizlet). Lernende sind aktive ProduzentInnen 
des Lernprozesses. 

6. Kollaboration: Lehrende und Lernende arbeiten aktiv innerhalb ei- 
nes digitalen Frameworks zusammen, um lektionsspezifische und 
ergänzende Aufgaben des möglichst digital vorliegenden Lehrwerks 
zu erledigen. 


Schon in den Jahren zuvor wurde deutlich, dass gerade Blended-Learning Kon- 
zepte dann zu mehr Lernerfolg führen als reiner face-to-face-Unterricht, wenn 
die Lernenden zu kooperativem Lernen aufgefordert wurden, sich als Grup- 
pe identifizierten und sie aktiv durch die Lehrkraft unterstützt wurden (vgl. 
Appel & Schreiner 2014: 5). Als besonders erfolgreich schnitten dabei auch 
bereits 2014 sog. Serious Games, bei denen Lernende selbst durch das Spiel 
navigieren können, ab (vgl. ebd.), immer unter der Prämisse, dass Lernende 
auch zum kollaborativen Austausch angeregt wurden und die Lehrkraft als 
Ansprechpartner/in zur Verfügung stand. Auch im Bereich DaF/DaZ wurden 
die Forderungen für den Bereich der Digitalisierung aufgegriffen: Funk (2019: 
76) differenziert zwischen konsumtivem, reaktivem, konstruktivem und kon- 
struktiv-kollaborativem Einsatz der digitalen Medien. Konsumieren bedeu- 
tet dabei beispielsweise Filme und Erklärvideos betrachten, reaktiv dann die 


5  www.edupad.ch 

6 www.todaysmeet.com 
7  www.tricider.com 

8 _ https://gather.town/ 
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zahlreichen auch in Lehrwerke integrierten Ubungsformen (z.B. Zuordnung, 
Multiple-Choice), die ein direktes (einfaches) Feedback geben. Konstruktiv 
und konstruktiv-kollaborativ ist dann das Arbeiten der Lernenden mit den 
Tools oder EduApps, also der konstruktivistische Einsatz der digitalen Medien. 
Die gleiche Forderung finden wir bei Roche (2019: 92f.), wenn er formuliert: 
„Die heutige Technologie müsste den Lernern nicht nur Erlauben, Sprache zu 
rezipieren oder zu imitieren, sondern sie auch befahigen, Sprache kreativ fiir 
Ausbildung und Alltag zu produzieren“. Und auch Rösler (2019: 14 FN) fordert 
zum aktiven Umgang mit den digitalen Tools auf und argumentiert: „Mit der 
Aufgabenorientierung sollen die Lernenden dazu gebracht werden, motiviert 
eigene Aktivitäten in der fremden Sprache vorzunehmen“. 

Aus diesen Erkenntnissen entwickelten wir an der Johannes Guten- 
berg-Universität das in Ersch (dieser Band) dargestellte Konzept des Inverted 
Classroom für unsere Studierenden und evaluierten dieses. Besonders positiv 
bewertet wurde dort die Möglichkeit des sozialen Austauschs, das kollabora- 
tive Zusammenarbeiten und die Erreichbarkeit der Dozierenden. Aus diesen 
Erfahrungen und den o.a. EduApps wurde ein Konzept auch für den Fremd- 
sprachenunterricht entwickelt und in den angesprochenen Weiterbildungen 
vorgestellt und ebenso veröffentlicht (vgl. Grein 2020a, Grein 2020b). Das 
Konzept wird im nächsten Kapitel kurz skizziert. 


2 Konzept zum Ausgleich der digitalen Distanz 


In Grein (2020a: 0.8.) wird deutlich formuliert, dass die soziale Eingebunden- 
heit und der soziale Austausch zentrale Faktoren für den Lernerfolg sind. In 
Anlehnung an Alexiou-Ray & Bentley (2016) wird argumentiert, dass die sog. 
digitale Distanz durch einen erhöhten Kontakt unter den Teilnehmenden und 
den Lehrkräften ausgeglichen werden muss. Dabei geht es vor allem um das 
Gefühl, sich austauschen zu können, nicht unbedingt um die Frequenz der 
Nutzung des Angebots. Vorgeschlagen wird der Einsatz eine Lernplattform 
(LMS), bei der die soziale Aktion im Vordergrund steht und nicht die Kontrolle 
der Leistungen. 
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Um die Aufmerksamkeitsspanne der Teilnehmenden nicht außer Acht zu 
lassen, wird empfohlen, die digital vorliegenden und inzwischen editierbaren 
Lehrwerke über Screensharing zu nutzen. In Grein (2020b) findet sich ein Vor- 
schlag für die zeitliche Einteilung eines 5-stündigen Intensivkurses (Abb. 1), 
den man dann an die zur Verfügung stehenden Zeit anpassen kann. Zentral 
sind dabei die Phasen, in denen die Teilnehmenden kollaborativ zusammenar- 
beiten. Dabei kann man sowohl die Übungen und Aufgaben aus dem Lehrwerk 
verwenden, aber auch die o.a. EduApps. Konkrete Beispiele folgen. Grund- 
sätzlich wird empfohlen den Plan den Bedürfnissen der Lernenden anzupas- 
sen, also Flexibilität bei der Gestaltung des Online-Unterrichts zuzulassen. 
Je nach Lerntraditionen oder der vorhandenen Medienkompetenz bedarf es 
einer Anpassung vor allem der Zeiten für die Erklärungen der zum Einsatz 
kommenden EduApps. 

Wie sieht der vorgeschlagene Ablauf aus? 


10:00-10:10 Plenum im virtuellen Raum 
Begrüßung, Austausch, Fragen klären 


10:10-10:50 Plenum im virtuellen Raum; Versuch alle zur Mitarbeit 
Lehrwerkbasierter Unterricht zu aktivieren 

10:50-11:15 

Partner- & Gruppenarbeiten (aus Lehrwerk) Virtuelle Kleinräume 

11:15-11:30 

Präsentation der Ergebnisse Plenum im virtuellen Raum 

11:30-11:45 Anregung zu Bewegung 

PAUSE Lehrkraft steht im virtuellen Raum zur Verfügung 
11:45-12:15 Plenum im virtuellen Raum; Versuch alle zur Mitarbeit 
Lehrwerkbasierter Unterricht zu aktivieren 

12:15-12:30 

Aufgabenstellung für Partner- Gruppenarbeiten Plenum im virtuellen Raum 


(binnendifferenzierend) 
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12:30-13:15 
Partner- und Gruppenarbeit zur Wiederholung z.B. Virtuelle Kleinräume 
mit digitalen Tools 


13:15 
Treffen im Plenum; Diskussion wie viel Zeit die Plenum im virtuellen Raum 
Gruppen noch benötigen 


13:30-14:00 
Mittagspause 


14:00-14:15 

Lehrkraft wartet im virtuellen Raum, je nach 
weiterhin benötigter Zeit und „redet“ mit den 
Anwesenden 


14:15-15:00 

Lernende präsentieren Ihre Zusammenfassungen 

des Lernstoffs; die anderen probieren die Plenum im virtuellen Raum 
„Aktivitäten“ der jeweils anderen Gruppen 


15:00 
Zusammenfassung und Dank durch die Lehrkraft - 
Verabschiedung 


Abb. 1: Möglicher Aufbau eines 5-stündigen Online-Kurses 


Die Aufgabenstellung muss präzise sein und möglichst unterschiedliche Edu- 
Apps sollten angeboten werden, daher benötigt die Aufgabenstellung tatsäch- 
lich oftmals 15 Minuten. 

Wie kann das nun konkret aussehen? Auszug aus dem Lehrwerk Momente 
(Hueber): 
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f 10 |(10 von 109) » = T d&a IB Q Q | Originalgröße 


Wie heißt du? ası-3 


a Hören Sie noch einmal und ergänzen Sie. 


© Wie Ich bin heißt wer 


Wee, heilst du? 


| o 

| a ich DIN Andrea 

| © Ah, du DISt___ Andrea 
| j o 


Andrea. A-N- D -R - E-A. 
Und bist du? 
o heiße Miriam. 


heißen sein | 


ich heiße bin 


| Ritte arbeiten Sie 
du heißt bist | alleine 


á 
© b Das Alphabet. Hören Sie und sprechen Sie nach. =) 


Aaf Bb biG} Daj Be) EL | Ce | HH Jj | Namen buchstabieren mit 
[a] [Be] Ice] [De] [E] [Ef] [Ge] [Ha] m Dot] \Konsonanten = Arme hoch; 
\Vokale = Arme zur Seite 


Kk | Li [Mmf Nn | Oo | Bp | Qa | Rory | Ss SE 
[Ka] te) [Em] [En] 10] Bel [Qu] Er Es] [Te] 
á 
U,u Viv Ww Xx Y,y Z,z Aya 6,6 Ua R | 
tw [Vau] [We] ix] [Ypsilon] [Zett]  [A-Umlaut] [O-Umlaut] [U-Umlaut]  [Es-Zett] =] 
un 


Abb. 2: Auszug aus dem Lehrwerk Momente (Hueber Verlag) mit integrierten Anweisungen/ 
Tipps (Original in Farbe) 


Mit den Editiertools können Arbeitsanweisungen direkt in das Lehrwerk in- 
tegriert werden. Aktivierende Übungen, wie hier das bewegte Buchstabieren, 
können als Tipp im Lehrwerk notiert werden, so dass auch im Plenum „Be- 
wegung“ stattfindet. 

Alle Hörtexte, Filme und reaktive Übungen können sofort gestartet werden. 
Bei den Hörtexten und Filmen kann man darüber hinaus die Geschwindigkeit 
regeln. Hier kann dann die erste EduApp Gathertown, bei der die Lernenden 
sich durch den Raum bewegen, zum Einsatz kommen. 


—_ 
© © Hören Sie. Machen Sie dann einen Kursspaziergang und fragen Sie ur na 
drei Personen. Notieren Sie die Vornamen und die Familiennamen. Mier- kann man, bereits: 
in gather.town wechseln 
© Hallo. Ich heiße David Ramos. https: //gather.town/app 
= Entschuldigung. Wie bitte? S \/iIbmpNthlmpB88hU/Mario 
© David Ramos. B n Grein 
D-a-v-i-d R-a-m-o-s Vomame Familienname | 
| 4 
a Danke. A David Ramos \ 
© Und wer bist du? 2 


a 


Mein Name ist | 


pw 


| 
® Wie geht’s? asa 
Wie geht es Andrea und Miriam? Hören Sie und kreuzen Sie an. | 


© a ®© a a | 
<- eo = S | 
| 


© Super! / Sehr gut! > Gut O Es geht © Nicht so gut | 


Abb. 3: Auszug aus dem Lehrwerk Momente (Hueber Verlag) mit integrierten Anweisungen/ 
Tipps (Original in Farbe) 
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PARTICIPANTS (2) $+ 


Q menon me) 


< LOCAL CHAT 


Marion ara 
Hallo 


message to nearby. 


Abb. 4: Screenshot aus Gathertown (Original in Farbe) 


In Gathertown werden Kamera und Mikrofon erst aktiv, wenn man nahe bei- 
einandersteht, so dass man hier Partner- und Gruppenarbeiten durchführen 
kann. Die Teilnehmenden loggen sich ein und laufen mit den Pfeiltasten durch 
den Raum, um auf andere zu treffen. 

Ein weiteres Tool sind learning.apps’, mit dem die Teilnehmenden unter- 
schiedliche Übungsformen jeweils für die anderen erstellen können (Abb. 5). 
Hier wiederholen die Teilnehmenden und überlegen, welche der vielen 
Übungsformen sie dafür verwenden wollen. 


9  https://learningapps.org/ 
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© 4 Das ist Simon. AB5-9 
a Wer sagt was? Hören Sie das Gespräch weiter und ergänzen Sie: 
Andrea = A, Miriam = M, Simon = S 
© 1 ® Woher kommstıdu, Miriam? 
2 © Ich komme aus Eritrea. Und du? 
3 © Ich komme aus Deutschland. 
4 © Wer ist das? 
5 © Das ist Simon. Das ist Miriam. 
6 © Sie kommt aus Eritrea. Sie lernt Deutsch. 
7 © Er heißt Simon. Er kommt aus der Schweiz. 
8 © Tschiis, Andrea. 
9 © Auf Wiedersehen, Andrea! 


b Markieren Sie ich, du, er/sie und die Verben in a und ergänzen Sie dann. =i min g . ap ps 


kommen lernen heißen sein 


https://learningapps. 
org/watch? 
v=pt6c0adj320 ZA 


ich komm lerne heiße bin 


du kommst lernst heißt bist | [c] 
: | Simon > er 
er/sie komm... lern... heiß... ist | ae 
| 
EN Q 


Abb. 5: Auszug aus dem Lehrwerk Momente (Hueber Verlag) mit integrierten Anweisungen/ 
Tipps (Original in Farbe) 


In Form von „Wer wird Millionär“ (Abb. 6) können die Lernenden Verständ- 
nisfragen selbst „programmieren“ und mit den anderen teilen. Da die unter- 
schiedlichen Gruppen andere Übungstypen wählen, hat man hier eine gute 
Form der Wiederholung, da die Lernenden auch die Übungen ihrer Mitler- 


nenden lösen. 


Woher kommt Simon? 


aus Österreich aus der Schweiz 


aus Deutschland 


Abb. 6: Übung zum Lehrwerkstext erstellt mit learning.apps (Original in Farbe) 
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Für das Plenum kann man wieder „Bewegung“ in den Unterricht bringen: 


1 Ich heiße Lydia. a = Arme über den Kopf 


Sehen Sie das Bild an. Was sagen die Personen? b = mit Armen ein B formen 


Was meinen Sie? Kreuzen Sie an. 


Arno und Lydia 
oe 


1 O sind 28 (= achtundzwanzig) Jahre alt. 3 O haben Kinder. 
sind 38 (= achtunddreißig) Jahre alt. haben keine Kinder. 


2 O sind verheiratet. CO 4 O wohnen in Berlin. 
D sind nicht verheiratet. j=] O wohnen in München 


> wohnen in Wien 
<) b Hören Sie und vergleichen Sie. 


KOMMUNIKATION: über den Beruf und 


önliches sprechen: 


n. HÖREN/LESEN SCHREIBEN etpro 


en WORTER: Be O GRAMMATIK 


als, bei, in + V 


x 


dreizehn 


Text 
Singular und 
ing: Endung -in 


c = c mit den Fingern formen 


m} 


Abb. 7: Auszug aus dem Lehrwerk Momente (Hueber Verlag) mit integrierten Anweisungen/ 


Tipps (Original in Farbe) 


Für das kollaborative Arbeiten stehen zahlreiche Tools zur Verfügung: 


L — Lydia + Arno > sic | ml 


b Schreiben Sie fünf Sätze über Lydia und Arno. edupad 


Das sind Lydia und Amo. Sie sind 


sie wohnen leb hab: 
© c Würfelspiel: Wir leben in Berlin. Arbeiten Sie in aa =| s. 82 D 


Grammatik Erklärvideo 


@ 3 Wie alt seid ihr? 484-6 https://online- 
a Hören Sie und sprechen Sie nach. Avierschn Wuerfel.de/ 
Hören Sie dann noch einmal und á 
© notieren Sie die fehlenden Zahlen. 
On) i eae) 3 Big Ss Bee 7 8 > u Er 
null eins zwei drei vier fünf sechs sieben acht neun zehn elf zwölf 


wohnen leben sein habggam) https: //edupad.ch/p/VXK5IcMSPQ 


M 


Abb. 8: Auszug aus dem Lehrwerk Momente (Hueber Verlag) mit integrierten Anweisungen/ 


Tipps (Original in Farbe) 


Zum einen kann man über das Internet würfeln. Kollaborativ und mit gro- 


Ber Kreativität (oder auch nicht > Binnendifferenzierung) schreiben die 


Teilnehmenden gemeinsam einen Text zu Lydia und Arno (siehe Abb. 8) 


auf edupad.ch”. 


10 https://edupad.ch/ (Hier ein B2-Kurs zum Testen). 
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BDC} FO RS 
[dia ist gestern heimgekommen und hat eine tote Katze auf ihrem Balkon gefunden. 

hört gern Musik 

Lydia besucht am Wochenende ihre Freundin Patrizia. 

Lydia verdient ihr Geld als Model für Deutschbücher. 

Lydia findet Frankfurt schön 

Lydia wohnt in Berlin 

‘Amo hat eine Frage an den Hueber Verlag: gibt es so ein tolles Buch auch für Französisch oder Spanisch? 

Arno isst zum Frühstück gern Nutellabrot mit Tomaten 

Lydia ist nicht sehr glücklich. Ihr Freund hat sie unerwartet verlassen. Deshalb versteht sie die Welt nicht mehr. Bisher hat sie immer auf Wolke 7 geschwebt. Wie soll ihr Leben nur 
weitergehen? 

hat 4 Kinder 

ist eine Langweilerin 


‘Amo ist nett, wenn er nicht gerade Hunger hat. Aber es gibt ja zum Glück Nutella und Tomaten. 
Dann gebt ihm was zu essen! 
Er hat eine Bewerbung an die Firma XOFF geschrieben. 


Arno liebt Spinnen Aber nicht zum Frühstück 
is aber er fürchtet sich trotzdem vor ihnen 
Echt? Angstliebe? ja, ganz schlimm 

Aha! Alles klar! :-) 


Abb. 9: Edupad zu zwei Protagonisten aus dem Lehrwerk Momente (Hueber Verlag) (Original 
in Farbe) 


Die von mir im Unterricht am haufigsten eingesetzten Tools sind Padlet und 
der Bookcreator'', bei dem die Teilnehmenden wieder gemeinsam etwas er- 
arbeiten. Bei Padlet gebe ich den Teilnehmenden jeweils den Link und alle 
können zeitgleich aktiv werden. Hier Beispiele meiner Padlets: 


Evaluation des Seminars im Mein mehrsprachiges Profil DaF / DaZler*innen an der Fragen und Wünsche 
Austausch Uni Wien 


Marion Grein Marion Grein Marion Grein 
vor 23 Stunden vor etwa einem Tag vor 2 Tagen 


Ich habe in meinem Leben Ich bin ein Obst Poster von Ihnen Was haben wir 
schon einmal gemeinsam? 


Marion Grein Marion Grein Marion Grein Marion Grein 
vor 6 Tagen vor 6 Tagen vor 6 Tagen Vor 8 Tagen 


Welche Apps nutze ich Jetzt raten Sie! Meine Familie in Chronolgie Brainstorming Lernen und 
Gehirn 


Marion Grein Marion Grein Marion Grein Marion Grein 
vor 8 Tagen vor 8 Tagen vor 8 Tagen vor 9 Tagen 


Abb. 10: Auswahl der Padlets von Marion Grein (Original in Farbe) 


Beim Bookcreator startet einer der Teilnehmenden ein „neues“ Buch und teilt 
dann den Einladungscode mit den Mitgliedern ihrer oder seiner Gruppe: 


11  https://bookcreator.com/ 
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Abb. 11: Screenshot Bookcreator (Original in Farbe) 


Mit dem Bookcreator erstellen die Lernenden ein eigenes Produkt, das sie dann 
im Plenum den anderen vorstellen. Diese Beispiele wurden in den Seminaren/ 
Workshops usw. vorgestellt und mit den Lehrenden diskutiert. Der Einsatz 
dieser Variante des virtuellen Sprachunterrichts wurde in der Studie und in 
der folgenden Darstellung als Typus 5 ausgemacht. Doch welche Formen des 
Sprachunterrichts ergaben sich aus den Gesprächen mit unterschiedlichen 
Institutionen? 


3 Die unterschiedlichen Umsetzungen 
des virtuellen Sprachunterrichts 


Bei den einzelnen Fortbildungen wurden die Sprachkursleitenden nach ihrer 
Umsetzung des virtuellen Sprachunterrichts gefragt. Dabei ergaben sich grob 
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fünfunterschiedliche Typen, die jedoch sicherlich durch weitere Typen ergänzt 
werden müssen und sich durch zahlreiche weitere Faktoren unterscheiden. 
Manche Institutionen haben dabei auch mehrere Varianten eingesetzt. Gebün- 
delt ergeben sich die folgenden fünf Typen des virtuellen Sprachunterrichts: 


Typ 1: Der Unterricht wird lediglich über ein Webchat-Tool so wie herkömm- 
lich gestaltet, ohne Integration der digitalen Versionen der Lehrwerke und 
ohne den Einsatz von ergänzenden Tools. Die Lernenden haben ihre Lehrwer- 
ke vor sich liegen und die Lehrkraft versucht, die Teilnehmenden zur Mitarbeit 
und zu Aktivitäten anzuregen. Die Lehrkräfte berichten, dass das vor allem mit 
Lernenden, die sie bereits kennen, recht gut funktioniert. 


Typ 2: Der Unterricht wird auch hier über ein Webchat-Tool angeboten, al- 
lerdings wird die digitale Variante des Lehrwerks genutzt, so dass Hörtexte 
und Filme leicht gezeigt werden können. Weitere Tools kommen hier nicht 
zum Einsatz. 


Typ 3: Manche Institutionen haben in der ersten Phase auf vorhandene Lern- 
plattformen zurückgegriffen und auf den Einsatz von Lehrwerken verzichtet. 
Das vhs-Portal diente dabei ursprünglich als Ergänzung zur Präsenzlehre, 
wurde aber dann auch als Plattform zum selbstständigen Lernen angeboten. 
In meiner Evaluation des Lernportals (Grein 2020c) wurden die positiven Ei- 
genschaften bereits hervorgehoben, allerdings kam ich dort zu dem Schluss, 
dass es sich perfekt zur Ergänzung der Lehre anbietet, aber nicht als Plattform 
zum selbstständigen Lernen (vgl. Grein 2020c: 14). Positiv bewertet wurden 
die Möglichkeiten sich über einen Chat (nur schriftlich) auszutauschen, mit 
Foren zu arbeiten und das Tutorensystem. Hinzugekommen ist eine Pinn- 
wand. Inzwischen gibt es auch Volkshochschulen, die das vhs-Portal mit den 
Lehrwerken der drei Verlage Hueber, Klett, Cornelsen kombinieren; das ist 
sicherlich eine ideale Lösung. Während telc m.E. hervorragende Prüfungen 
erstellt'?, sind deren Lehrwerke nicht kompetenz-, sondern eher prüfungsori- 
entiert (vgl. Tornero Perez 2019: 557), so dass ich den Einsatz nicht empfehlen 


12 Vgl. Jehle in diesem Band. 
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würde. Laut Aussagen vieler Befragter wird jedoch häufig auf das Selbstlernen 
und die Korrekturen der Aufgaben zurückgegriffen. Diese Form verstehe ich 
in der Studie als Typ 3. 


Typ 4: Parallel zu den Angeboten des vhs-Lernportals hat das Goethe-Institut 
eine von Lehrwerken unabhängige Lernplattform entwickelt, die über sehr vie- 
le reaktive Übungstypen, Hörtexte, Filme usw. verfügt und zum selbstständigen 
Lernen gedacht ist. Das Prinzip entspricht dabei dem des Inverted Classroom. 
Die Lernenden lernen selbstständig und haben dann regelmäßige Treffen mit 
den Lehrenden. Die Gespräche mit einigen Lehrkräften waren sehr heterogen: 
Manche argumentierten PRO aufgrund der erhöhten Lernendenautonomie 
und der Flexibilität bezüglich der Uhrzeit, zu der die Teilnehmenden an den 
Online-Kursen teilnehmen können. Der Mehrheit fehlte jedoch der soziale 
Austausch, vor allem unter den Kursteilnehmenden selbst. Die Inhalte der 
Lernplattform sind sehr ansprechend, integrieren jedoch keine EduApps. Pro- 
bleme werden auch mit dem Konferenztool Adobe Connect geäußert. Lediglich 
eine Lehrkraft ergänzte die Plattform DUO, die eine Zwischenform zwischen 
Typ 3 und 4 darstellt. DUO richtet sich an zukünftige Studierende und arbeitet 
mit einem Tutorensystem, in dem gerade bei Anfängern und Anfängerinnen 
sehr viel Wert auf Voice-Chats gelegt wird. Die Materialien finden sich alle 
auf der Lernplattform und das Selbstlernen steht im Vordergrund. Es werden 
jedoch unterschiedliche Varianten angeboten (siehe https://www.deutsch-uni. 
com/de/; 25.10.2020). 


Typ 5: Hier wird das von mir in Kapitel 2 dargestellte Konzept verwendet, also 
digitales Lehrwerk und die Integration durch zahlreiche EduApps, die auch den 
sozialen Austausch fördern. 

4 Die kurze Studie 

Um zu quantifizieren, welche der fünf genannten Typen wie oft zum Einsatz 


kommt, wurde eine sehr kurze Online-Umfrage über SurveyMonkey (Oktober 
2020) durchgeführt. Die Ergebnisse zeigen lediglich Tendenzen, und es bedarf 
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zahlreicher weiterer, vor allem auch qualitativer Studien. Zahlreiche Fragen 
werden in den zum Wintersemester 2020/21 angemeldeten Masterarbeiten 
aufgegriffen. Derzeit haben 200 Lehrende an der Umfrage teilgenommen, die 
Befragung bleibt jedoch für weitere Ergebnisse auch nach Veröffentlichung des 
Artikels offen, um die Daten zu validieren. 

Zunachst wurde nach dem (vorwiegenden) Typus des virtuellen Unter- 
richts gefragt. Hier gab es Rtickmeldungen, dass manche Lehrende an unter- 
schiedlichen Institutionen mit unterschiedlichen Typen arbeiten. Diese eignen 
sich daher dann besonders fiir eine qualitative Befragung. Wie sah nun die 
Verteilung aus? 


Teilnehmende (N=200) 
Webtool, digitales Lehrwerk und Einsatz weiterer Sn 33,589 
99,907 
digitaler Tools (z.B. Padlet, Kahoot, Learning .apps) ° 


Online-Plattformen (Selbstlernen) und = 
ER 10,45% 
regelmäßige Sitzungen 


= ENGE 9,70% 
vorwiegend "Korrekturfähigkeiten 


Webtool und Unterricht wie gehabt mit digitalem 
Lehrwerk (ohne zusätzliche Tools) 


Online-Plattform zum Lernen (Selbstlernen) und ie) 
BE: 


t a0, 
‚72% 


Webtool (z.B.) ZOOM) und Unterricht wie SSS ee 409 
"gehabt" ohne digitales Lehrwerk if 


0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 


Immerhin etwas mehr als ein Drittel der Lehrenden haben folglich ihren vir- 
tuellen Unterricht so konzipiert, wie in meinen Weiterbildungen und Fortbil- 
dungen favorisiert (Typ 5). Ca. 20% haben die Selbstlernvarianten gewahlt oder 
wählen müssen, da von der Institution vorgegeben (entspricht Typen 3 & 4). 

Die zweite Frage bezog sich auf das eingesetzte Video-Chat Tool und zeigte, 
dass das Konferenztool Zoom zweifelsohne an erster Stelle steht. 
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Teilnehmende (N=200) 


andere x — 16,50% 
Adobe Connect EEE 12.80% 
Cisco Webex [RRR 4,11% 
Microsoft Teams M- 11,63% 
BibBlueButton Hi 4,79% 


ZOOM N 53% 


0% 10% 20% 30% 40% 50% 60% 


Bei den Kommentaren findet sich wiederum der Hinweis, dass manche Leh- 
renden mit mehreren Video-Chat Tools gearbeitet haben. Nicht aufgeführt 
wurden GoToMeeting, Edudip, Jitsi, da nur von wenigen genutzt. Ergänzt wur- 
den Vitero, Google Meet, Skype, Collaborate, und Moodle, wobei Moodle ein 
LMS und kein Webchat-Tool ist. Es ist daher zu vermuten, dass hier BigBlue- 
Button nicht aktiviert war. 

Spannend nun die 3. Frage, bei der die Teilnehmenden eine kurze Gesam- 
tevaluation abgeben, die es dann mit den eingesetzten Typen zu korrelieren 
gilt. Zunächst das Gesamtbild: 
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Teilnehmende (N=200) 


Ich habe den Kurs abgebrochen 


BB 200% 
Es sagt mir überhaupt nicht zu, nur bei face-to- 
face lernen die Lernenden die Sprache 


Es war okay, aber ich bevorzuge den "richtigen" 
Sprachunterricht 
Es hat sehr viel Spaß gemacht, aber ich wünsche | 40,00% 
mir einen Wechsel zwischen virtuell und face-... ch ia 
Es hat mir sehr viel Spaß gemacht - gerne weiter Sas 20% 
~ 20% 
so 


0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 


Immerhin 20% der Befragten können sich gut vorstellen, ihren Fremdspra- 
chenunterricht auch in Zukunft virtuell anzubieten. Lediglich ca. 10,2% konn- 
ten sich mit dem Online-Unterricht gar nicht anfreunden. Sehr spannend und 
sicherlich zukunftsweisend sind die 40%, die sich in der Zukunft ein hybrides 
Konzept vorstellen können, also den Wechsel zwischen face-to-face und vir- 
tuellem Sprachunterricht. 

Die Aussage „es hat sehr viel Spaß gemacht - gerne weiter so“ (N=40) 
verteilt sich wie folgt auf die fünf Typen: 


Teilnehmende (N=40) 


Webtool, digitales Lehrwerk und Einsatz weiterer 


digitaler Tools (z.B. Padlet, Kahoot, | - 52,00% 


Learning.apps) 


Online-Plattformen (Selbstlernen) und i 2.008 
regelmäßige Sitzungen ne 


Online-Plattform zum Lernen (Selbstlernen) und E 3,00% 
vorwiegend "Korrekturfahigkeiten" ee 


Webtool und Unterricht wie gehabt mit digitalem |e 5.00% 
Lehrwerk (ohne zusätzliche Tools) a a 


Webtool (z.B.) ZOOM) und Unterricht wie sr 38% 
"gehabt" ohne digitales Lehrwerk [oo 
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Bei sowohl Typus 1 (38%) als auch Typus 5 (52%) können sich einige die 
virtuelle Lehre auch in der Zukunft vorstellen; bei den Selbstlern-Plattformen 
sind es deutlich weniger (5%), die sich damit anfreunden können. Hier zeigt 
sich vor allem der Bedarf an weiteren Studien, in denen erhoben wird, wie der 
Unterricht in Typus 1 umgesetzt wurde, denn auch hier sind viele Lehrende 
sehr zufrieden mit ihrem Online-Sprachkurs. Einer genaueren Analyse bedarf 
auch das Ergebnis, dass die reinen Selbstlernkurse als weniger erfolgreich ein- 
gestuft wurden. Was genau sind die Gründe? 

Korrelieren wir noch die beiden Selbstlernkurse (Typ 3 und Typ 4) mit 
der Frage 3: 


Teilnehmende (N=20) 


250; 
Ich habe den Kurs abgebrochen 6,25% 


u oe ; 27,00% 
Es sagt mir überhaupt nicht 21 A 36,60% 


Es war okay, aber ich bevorzuge den "richtigen 43,70% 


Sprachunterricht E 35,10% 


Es hat sehr viel Spaß gemacht, aber ich wünsche mir 20,70% 


einen Wechsel zwischen virtuell und face-to-face E- 25,30% 
A s 9 
Es hat sehr viel Spaß gemacht - gerne weiter so jug “33, 


0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 


Selbstlernen und regelmäßige Treffen E Selbstlernen und Beratungstätigkeit 


Offensichtlich hat den Lehrenden das Konzept ,,Selbstlernen mit den regel- 
mäßigen Treffen“ (Typ 4) am wenigsten Spaß gemacht. Es gilt also in einer 
weiteren Studie zu erheben, warum dieser Typus am wenigsten positiv bewertet 
wurde. Zwei Lehrende haben den Kurs sogar abgebrochen. 

Gefragt wurden die Teilnehmenden dann auch, ob sie annehmen, dass den 
Lernenden der Unterricht gefallen hat. Betrachten wir zunächst wieder den 
Gesamtüberblick: 
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Wie denken Sie wiirden Ihre Teilnehmenden den Kurs bewerten? 


Teilnehmende (N=200) 
Sehr negativ E 197% 
Negativ as) 5,26% 
Ener posi >; 2: 
Schr positv s O 


Extrem positiv E 3% 


0% 10% 20% 30% 40% 50% 60% 


Die Lehrenden sind also im Durchschnitt zufrieden mit Ihrem Sprachkurs. 
Die wenigen negativen Einschätzungen sind wiederum den Selbstlernkursen 
zuzuordnen. 

Es wurden zwei weitere Fragen - auf Wunsch auch der Befragten - hin- 
zugefügt: Zum einen die Frage nach der Vorbereitungszeit, zum anderen die 
Frage nach dem finanziellen Ausgleich bei größerer Vorbereitungszeit. 


Teilnehmende (N=200) 


Ich habe mehr als 30% mehr Zeit benötigt Te] 22,08% 
Ich habe ca. 30% mehr Zeit benötigt er 16,23% 
Ich habe ca. 20% mehr Zeit benötigt e 20 75°. 
Ich habe ca. 10% mehr Zeit benötigt SSS 14,29% 
Ich habe ungefähr gleich viel Zeit benötigt | — 20 13°. 
Ich habe weniger Zeit benötigt EEE 6° 


0% 5% 10% 15% 20% 25% 
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Eine Korrelation zum Kurstyp ist hier nicht auszumachen. 

Deutlich wird jedoch, dass die meisten Lehrenden einen erheblichen Mehr- 
aufwand bei der Vorbereitung der Kurse hatten, der jedoch sicherlich, wird 
der gleiche Kurs noch einmal angeboten, geringer ausfallen wird. Trotz des 
erhöhten Aufwands gab es in den meisten Fällen keinen finanziellen Ausgleich. 

Hierbei ergibt sich folgende Verteilung: 


Teilnehmende (N=200) wre cap ke 
S ga einen 


90,00% Ausgleich 
78,57% 81,25% 4,00% Das Gehalt wurde 
gekürzt 
m Das Gehalt wurde 
erhöht 
3,08% 14,29% 
“A Zi u E 
Typus 1 Typus 2 Typus 3 Typus 4 Typus 5 
5 Zusammenfassung und Kritik 


Ziel der sehr kleinen Prästudie war es, einen Überblick über die derzeit einge- 
setzten virtuellen Sprachkurse zu erhalten. Der in Kapitel 2 dargestellte Ansatz, 
also der Typus 5, wurde dabei etwas besser bewertet als die anderen Typen, wo- 
bei auch der Typus 1 sehr viel erfolgreicher bewertet wurde als angenommen. 
Die reinen Online-Kurse (Selbstlernkurse) schneiden insgesamt am schlech- 
testen ab. Diese Prästudie hat zahlreiche Schwachpunkte, die in Folgestudien 
ausgeglichen werden müssen. Allem voran wurde nicht nach Kursform (DaF/ 
DaZ), Niveaustufe und Jahren der Lehrerfahrung differenziert. Auch die ein- 
zelnen Typen müssen in Folgestudien sehr viel ausführlicher beschrieben und 
stärker differenziert werden. Grundsätzlich zeigt sich jedoch die Tendenz, dass 
der Sprachunterricht in Zukunft stärker hybrid gestaltet werden kann und den 
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Institutionen bewusst werden muss, dass qualitativ guter Online-Unterricht 
mehr Vorbereitung benötigt als der herkömmliche face-to-face-Unterricht, 
auch wenn die Vorbereitungszeit nach einer gewissen Eingewöhnungsphase 
wahrscheinlich etwas geringer werden wird. 


Bibliografie 


ALEXIOU-Ray, J. & BENTLEY, C.C. (2016): „Faculty Professional Develop- 
ment for Quality Online Teaching’, in: Journal of Distance Learning Ad- 
ministration 18/4: 1-16. 

APPEL, M. & SCHREINER, C. (2014): „Digitale Demenz? Mythen und wis- 
senschaftliche Befunde zur Auswirkung von Internetnutzung‘, in: Psy- 
chologische Rundschau 65/1, Göttingen: Hogrefe Verlag: 1-10. 

DE FLorıo-HanseEn, I. (2018): „Lehren und Lernen von Fremdsprachen 
im Kontext der Digitalisierung‘; in: MARTINEZ, H. & MEISSNER, F.-J. 
(Hrsg.): Fremdsprachenunterricht in Geschichte und Gegenwart: Festschrift 
für Marcus Reinfried (Giessener Beiträge zur Fremdsprachendidaktik), 
Tübingen: Narr: 291-302. 

EICKELMANN, B., LORENZ, R. & ENDBERG, M. (2016): „Die eingeschätzte 
Relevanz der Phasen der Lehrerausbildung hinsichtlich der Vermittlung 
didaktischer und methodischer Kompetenzen von Lehrpersonen für den 
schulischen Einsatz digitaler Medien in Deutschland und im Bundeslän- 
dervergleich‘; in: Bos, W. et al. (Hrsg.): Schule digital - der Länderindika- 
tor 2016. Kompetenzen von Lehrpersonen der Sekundarstufe I im Umgang 
mit digitalen Medien im Bundesländervergleich, Münster: Waxmann: 
149-182. 

Funk, H. (2019): „Feindliche Übernahme oder erweiterte didaktisch- 
methodische Szenarien? Fremdsprachenunterricht in Zeiten des digita- 
len Wandels“, in: BURWITZ-MELZER, E. RIEMER, C. & SCHMELTER, L. 
(Hrsg.): Das Lehren und Lernen von Fremd- und Zweitsprachen im digita- 
len Wandel, (Giessener Beiträge zur Fremdsprachendidaktik), Tübingen: 
Narr: 68-80. 


70 © Frank & Timme Verlag für wissenschaftliche Literatur 


Evaluation der unterschiedlichen virtuellen Sprachkursformen 


GREIN, M. & STRASSER, T. (2019): „Lernen mit digitalen Medien aus neu- 
robiologischer und fremdsprachendidaktischer Sicht“, in: Empfehlungen 
Goethe-Institut Zagreb: 7-15. 

GREIN, M. (2020): „Sprachunterricht auf einmal digital: Online-Lernen 
vor, während und nach Corona‘, in: Magazin Sprache, Goethe Institut, 
o.S., abrufbar unter: https://www.goethe.de/de/spr/mag/21927962.html, 
09.09.2020. 

GREIN, M. (2020b): „Digitalen Sprachunterricht interaktiv gestalten: nützli- 
che Tools und Tipps zur Anwendung‘ in: Magazin Sprache, Goethe In- 
stitut, 0.$., abrufbar unter: https://www.goethe.de/de/spr/mag/21927962. 
html, 09.09.2020. 

GREIN, M. (2020c): „Über das Lernen mit digitalen Medien (Interview)‘, in: 
vhs dis.kurs Ausgabe 1/2020, Bonn: Deutscher Volkshochschulverband 
e.V. 

LORENZ, R. & ENDBERG, M. (2019): „Welche professionellen Handlungs- 
kompetenzen benötigen Lehrpersonen im Kontext der Digitalisierung in 
der Schule? Theoretische Diskussion unter Berücksichtigung der Pers- 
pektive Lehramtsstudierender‘, in: Medien Pädagogik. Zeitschrift für The- 
orie und Praxisbildung der Medienbildung (Occasional Papers): 61-81, 
abrufbar unter: https://doi.org/10.21240/mpaed/00/2019.10.16.X. 

PERSIKE, M. & FRIEDRICH, J.-D. (2016): „Lernen mit digitalen Medien aus 
Studierendenperspektive‘, in: Arbeitspapier Nr. 17, Berlin: Hochschulfo- 
rum Digitalisierung. 

Rocne, J. (Hrsg.) (2019): Medienwissenschaft und Mediendidaktik, Tübin- 
gen: Narr. 

Roster, D. (2019): „Auf dem Weg zum Babelfisch? Fremdsprachenlernen 
im Zeitalter von Big Data‘; in: Informationen Deutsch als Fremdspra- 
che (published online ahead of print 2019), abrufbar unter: https://doi. 
org/10.1515/infodaf-2020-0060. 

SCHIEFNER-ROHS, M. & Autorengruppe (2018): „Lehrerbildung für die 
digitale Zukunft‘, in: Synergie. Fachmagazin für Digitalisierung in der 
Lehre 6: 48-55. 

SCHMIDT, T. & STRASSER, T. (2016): „Digital Classroom’, in: Der fremd- 
sprachliche Unterricht Englisch 50: 2-7. 


© Frank & Timme Verlag für wissenschaftliche Literatur 71 


Marion Grein 


TORNERO PEREZ, M. (2019): „Rezension zu Einfach gut! Deutsch für die In- 
tegration. Kurs- und Arbeitsbuch A1-B1 sowie Lehrerhandbuch A1-B1% 
in ZIF 24/2, abrufbar unter: https://tujournals.ulb.tu-darmstadt.de/index. 
php/zif/article/view/999/996, 25.10.2020. 

VAN ACKEREN, I. et al. (2019): „Digitalisierung in der Lehrerbildung. Her- 
ausforderungen, Entwicklungsfelder und Förderung von Gesamtkonzep- 
ten‘, in: Die Deutsche Schule 111/1: 103-119, abrufbar unter: https://doi. 
org/10.31244/dds.2019.01.10; 25.10.2020. 


Lehrwerk 


Evans, S., PUDE, A. & SPECHT, F. (2020): Momente, München: Hueber Ver- 
lag. 


72 © Frank & Timme Verlag fiir wissenschaftliche Literatur 


ANN-KATRIN FIERUS 


Learn to flirt by Duolingo „Du siehst aus wie meine nächste 
Freundin“ - Die Evaluation von Sprachlern-Apps für 
Deutsch als Fremdsprache in Bezug auf die Vermittlung 
interkultureller Kompetenz 


Einleitung 


Nutzen Lernende schon seit geraumer Zeit digitale Anwendungen zum Erler- 
nen einer Sprache, da sich mit dem Lernen durch Apps auch „‚empty‘ time 
slots during the day“ (Falk & Götz 2016: 238) füllen lassen, wurde das The- 
ma „Sprachlern-App“ im Frühjahr des Jahres 2020 wohl aktueller denn je. 
Durch Ausgangsbeschränkungen und Lockdowns vieler Länder verzeichne- 
ten Sprachlern-Apps wie etwa Duolingo einen deutlichen Zuwachs an Nutzer/ 
innen, so zum Beispiel allein im März 2020 von 108% (Ward 2020). Eine der 
meistgewählten Sprachen bei Nutzenden der englischen Version der Applika- 
tion war in diesem Zeitraum „German for English Speakers‘, welche von 8,18 
Millionen Menschen weltweit installiert wurde (ebd.) Zu dieser und anderen 
Online-Anwendungen wurden bereits verschiedene Umfragen, Analysen und 
Evaluationen durchgeführt (vgl. dazu Falk & Götz 2016, Usta 2017), welche die 
App, deren Funktionen und die Motivation der Lernenden zur Verwendung 
dieser Anwendung untersuchten. Laut Godwin-Jones fokussieren viele Studien 
zum Thema jedoch „only institutional use of mobile devices (i.e., in formal, 
instructed language learning). Few examine use out-side the classroom“ (2017: 
5). In Zeiten, in denen das Erlernen einer Fremdsprache jedoch im Klassen- 
raum nicht unbedingt möglich ist, bleiben Lernenden Sprachlern-Apps zum 
autonomen Sprachenlernen. Hierbei stellt sich die Frage, ob Lernende mit 
Satzbausteinen wie den im Titel genannten „Du siehst aus wie meine nächste 
Freundin“ aus der App Duolingo (Learn to flirt in German) jedoch wirklich 
auf den realen, kulturbezogenen Sprachgebrauch vorbereiteten werden. Denn 
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neben den zu erlernenden Fertigkeiten Lesen, Hören, Schreiben und Sprechen 
ist „interkulturelle Kompetenz, verstanden als grundlegende Handlungskom- 
petenz, für jeden Menschen essenziell“ (Grein 2019: 125). So müssen Lernende 
interkulturell kompetent sein, um mit Muttersprachler/innen des Deutschen 
erfolgreich zukommunizieren oder sich auf einen Aufenthalt im deutschspra- 
chigen Raum vorbereiten zu können, da nur so eine erfolgreiche Interaktion 
zwischen Menschen verschiedener Kulturen gelingen kann (vgl. Fuchs 2012: 
17). „[NJicht alle Teilkonstrukte [der interkulturellen Kompetenz, A-K.F.] sind 
vermittelbar. Voraussetzung ist jedoch die Sensibilisierung für kulturspezifi- 
sche Unterschiede“ (Grein 2019: 128); diese mit in den Fremdsprachenun- 
terricht sowie die hierfür verwendeten Lehrwerke mit einzubeziehen ist der 
Anspruch des modernen Fremdsprachenunterrichts. Auch Sprachlern-Apps 
erheben den Anspruch, ihren Nutzer/innen eine Sprache so zu vermitteln, 
dass „echte Kommunikation“ (Babbel 2020: 0.5.) möglich ist. Können Sprach- 
lern-Apps hier jedoch als Ersatz echten DaF-Unterrichts dienen, die nötigen 
Kompetenzen den autonom Lernenden ausreichend vermitteln und sie somit 
nicht nur in den vier Fertigkeiten, sondern auch für interkulturelle Themen 
sensibilisieren? 

Dieser Artikel beschäftigt sich mit der Frage, ob und wie interkulturel- 
le Kompetenz mit digitalen Anwendungen aufgegriffen wird und inwieweit 
Lernende dadurch für kulturelle Unterschiede sensibilisiert werden können. 
Hierfür werde ich drei der meist heruntergeladenen Apps - mit jeweils über 
10 Millionen Downloads im Google PlayStore (vgl. play.google.com) - Babbel, 
Duolingo und Busuu, auf interkulturelle Elemente und die Sensibilisierung und 
Förderung der interkulturellen Kompetenz ihrer Nutzer/innen untersuchen. 
Denn nur mit dieser lassen sich Sprachlern-Apps zumindest als kurzweiliger 
Ersatz für den interkulturellen Fremdsprachenunterricht einsetzen. In Kapitel 
1 wird somit zunächst kurz auf allgemeine Sprachlern- Apps eingegangen, ge- 
folgt vom zweiten Kapitel, das die interkulturelle Kompetenz und deren Rolle 
im Fremdsprachenunterricht fokussiert und eine Einschätzung zu erwartender 
interkultureller Komponenten in Sprachlern-Apps gibt. Im empirischen Teil 
(Kapitel 3) werden die beschriebenen Apps auf diese Komponenten hin unter- 
sucht und die Ergebnisse anschließend zusammengefasst, bevor ein Ausblick 
für den DaF-Unterricht gegeben wird. 
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1 Sprachlern-Apps 


Durch eine immer digitaler werdende Welt hat sich auch das Sprachenlernen 
längst im digitalen Bereich verfestigt und macht das so genannte Mobile Le- 
arning zum Alltag vieler Lernender: Während man auf einen Bus wartet, eine 
kurze Pause hat oder noch fünf Minuten Zeit bleiben, werden diese nicht nur 
dafür genutzt, sich mit Freunden auszutauschen oder Nachrichten zu lesen, 
sondern auch zum Sprachen Lernen (vgl. Falk & Götz 2016: 238). Der Begriff 
des M-Learnings beschreibt eben diese Flexibilität, die das Lernen mit einem 
mobilen Endgerät überall und zu jeder Zeit möglich macht und „betont [...] 
die räumliche Trennung von Lernen und dem Klassenzimmer“ (Usta 2017: 
11). Ein wichtiger Punkt des M-Learnings ist die Dauer der Lerneinheit, wel- 
che im Gegensatz zum festgelegten Unterricht kürzer und variabler ist (vgl. 
ebd., ebenso Lai & Zheng 2017: 307). So bietet M-Learning „not only the mo- 
bility oftechnology but also more importantly the mobility oftime, space, and 
learning experience“ (Lai & Zheng 2017: 300) und unterscheidet sich somit 
vom erweiterten Begriff des E-Learnings, welcher das Lernen mit digitalen 
Medien allgemein verknüpft. „Wenn man sich vor den Computer setzt, um 
mit einer Lernsoftware zu lernen, plant man ebenfalls eine bestimmte, evtl. 
längere, Zeit zum Lernen ein“ (Usta 2017: 11), beim M-Learning ist der/die 
Lernende flexibler, wobei das Konzept sich nicht auf Smartphones beschränkt, 
sondern beispielsweise auch Tablets hierfür genutzt werden können. Nutzen 
Lernende M-Learning, also z.B. Sprachlern-Apps, um Vokabeln zu lernen 
(vgl. Lai & Zheng 2017: 305) oder um die verschiedenen Fertigkeiten zu üben 
(vgl. Usta 2017: 58), besteht bei einem Vergleich verschiedener Apps eine 
Schwierigkeit: „Apps vary tremendously in purpose, scope, and design, and 
they need to be judged individually“ (Godwin-Jones 2017: 6). Trotz dieser 
Varietäten versprechen die meisten das Sprachenlernen dennoch „immer un- 
ter Berücksichtigung realistischer Szenarien“ (Babbel) und, dass Sprache als 
„Kommunikationsinstrument“ vermittelt wird, Lernende also „sehr schnell 
dazu bringt, [...] eine neue Sprache wirklich zu sprechen. Denn das ist die 
größte Motivation für jeden Lernenden“ (Babbel). Um dies zu erreichen, also 
eine Kommunikation mit Muttersprachler/innen erfolgreich durchzuführen, 
bedarf es nicht nur Vokabular und Grammatik, sondern auch der interkul- 


© Frank & Timme Verlag für wissenschaftliche Literatur 75 


Ann-Katrin Fierus 


turellen Kompetenz der Lernenden, auf die in den folgenden Abschnitten 


eingegangen wird. 


2 Interkulturelle Kompetenz und ihre Vermittlung 


Gilt die interkulturelle Kompetenz heutzutage als ,,die Fahigkeit individuelle, 
soziale, fachliche und strategische Teilkompetenzen in ihrer bestmöglichen 
Verknüpfung auf interkulturelle Handlungskontexte beziehen zu können“ 
(Bolten 2006, zit. in Grein 2019: 129), galt ihre Definition und Position im 
Fremdsprachenunterricht nicht von je her als gegeben, sondern bildete sich 
erst Anfang der 1980er Jahre als Unterrichtsziel heraus (vgl. Fuchs 2016: 18). 

Doch auch schon bevor die interkulturelle Kompetenz als übergreifendes 
Ziel des Fremdsprachenunterrichts angesehen wurde, wurde Kulturwissen 
im Teilgebiet der Landeskunde vermittelt. Im kommunikativen Ansatz woll- 
te man in der Landeskunde weitestgehend auf Fakten verzichten und sich 
auf alltägliche, eben kommunikative Situationen konzentrieren (vgl. Rösler 
2012: 203). Galt die Landeskunde somit zunächst als Mittel zum Zweck, also 
zur Themenfindung von Sprechanlässen, entwickelte sie sich in der Phase 
der problemorientierten Landeskunde zu einem Rahmen für interkulturel- 
le Vergleiche. Daraus resultierten seit den 1980ern die ersten Versuche, eine 
interkulturelle Landeskunde zu erreichen. Hierbei liegt der Hauptfokus laut 
Rösler (2012: 205) nicht auf „der Ebene des Wissens“ sondern auf „der Ebene 
der Einstellung“ zu Zielkultur und -sprache. Das Unterrichtsziel der heutigen 
interkulturellen Kompetenz erweitert das Konzept und fokussiert nicht nur die 
Zielkultur selbst, sondern bezieht die Reflexion der eigenen Kultur mit ein (vgl. 
Usener 2016: 7). Dennoch bleibt die Landeskunde selbst bedeutsam für die in- 
terkulturelle Kompetenz, da sie als „erster Schritt des interkulturellen Lernens“ 
gesehen werden kann (ebd.: 8). Cataldo (2017: 9) beschreibt die Entwicklung 
von Landeskunde zur interkulturellen Kompetenz als 


eine Bewegung, die sich immer konsequenter von der bloßen Vermitt- 


lung von Faktenwissen über die fremde Kultur entfernt und zu einer 
erweiterten Kommunikations- und Verstehensbereitschaft im inter- 
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kulturellen Kontext hinarbeitet. Hier werden Sprache und Kultur als 
untrennbar verstanden. Die Konsequenz daraus ist die IK als übergrei- 
fendes Kompetenzziel des [Fremdsprachenunterrichts, A.-K. F]. 


Da das Feld der interkulturellen Kompetenz sowie deren Vermittlung ein sehr 
komplexes ist, wurde seit den 1980er Jahren versucht, das Konstrukt aufzu- 
teilen und zu veranschaulichen. Grein (2018: 126) fasst zusammen, dass hier 
zunächst Teilkompetenzen wie „empathy“, „cultural awareness“ oder „respect 
for cultural differences“ herausgearbeitet wurden, während sich die Tendenz 
in der Forschung unter Berücksichtigung dieser Konzepte zu Strukturmodel- 
len verlagerte. Byram (1997) entwickelte beispielsweise eine Teilung in fünf 
Kompetenzen, sogenannte „savoir“, die aus Fachwissen, Einstellungen des Ler- 
nenden, dessen Fähigkeit, eine andere Kultur zu verstehen, neues Wissen zu 
erwerben und eine fremde Kultur kritisch zu reflektieren, bestehen (vgl. Catal- 
do 2017: 12, ebenso Usener 2016: 24). „Allerdings gehen einzelne Teilkompe- 
tenzen fließend ineinander über und sind nicht immer eindeutig voneinander 
abzugrenzen“ (Usener 2016: 24); eine Problematik, die sich auch auf andere 
Modelle übertragen lässt, welche die interkulturelle Kompetenz in kognitive 
(Wissen um kulturspezifische Unterschiede), affektive (Einfühlungsvermögen) 
und verhaltensbezogene (Respekt vor kulturspezifischen Unterschieden) ein- 
teilt (vgl. Grein 2019: 127). Auch wenn die Komponenten laut Grein (ebd.) 
von Müller & Gelbrich (2014) um Effektivität (Anpassungsfähigkeit) und An- 
gemessenheit (Befolgung von Regeln, Anerkennung von Gefühlen) ergänzt 
wurden, bleibt bei diesem strukturellen Modell zum einen das Problem der 
Abgrenzung, aber auch, dass die Teilgebiete nicht „getrennt voneinander ver- 
mittelbar“ sind. Aus dieser Problematik folgt, dass heutzutage unter Berück- 
sichtigung der drei Komponenten (affektiv, kognitiv, verhaltensbezogen) mehr 
prozessorientierte Modelle verwendet werden (vgl. ebd.). 

Als Voraussetzung zum Erwerb interkultureller Kompetenz wird hierbei 
das Bewusstsein des eigenen Ethnozentrismus gesehen, dass also Menschen 
die eigene Kultur als Normalität bewerten: 


Die Entwicklung eines neuen, eines reflektierten Ethnozentrismus ist 
deshalb das Ziel eines jeden interkulturellen Lernens und Trainings. 
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Irritationen und Fremdheitserfahrungen werden idealerweise kontrol- 
liert wahrgenommen und reflektiert, Abwertungen werden vermieden 
oder kontrolliert wahrgenommen und die eigenen Reaktionen werden 
in Selbstreflexion hinterfragt (Witzenleiter & Luppold 2020: 46). 


Um interkulturell kompetent agieren zu können, wird außer diesem Be- 
wusstsein jedoch auch Wissen darüber vermittelt, in welchen Bereichen sich 
Kulturen - ohne negative oder positive Bewertung dieser - unterscheiden 
können und eine damit verbundene „Sensibilisierung für kulturspezifische 
Unterschiede“ erreicht (Grein 2019: 128). Hierbei darf auch die Individualität 
eines Menschen nicht außer Acht gelassen werden (vgl. ebd.). So darf es zu 
keinem stereotypischen Kulturverständnis kommen, bei dem davon ausgegan- 
gen wird, dass alle Mitglieder einer Kultur ‚gleich‘ sind. Diese Idee findet sich 
als zentraler Punkt des Multikollektivismus wieder, der besagt, dass Menschen 
eines Kulturraums zu verschiedenen Kollektiven gehören können und diese 
verschiedenen Zugehörigkeiten eine Person ausmachen (vgl. ebd.). Dies stellen 
auch Witzenleiter & Luppold fest: „Eine Begegnung eines im Dorf lebenden 
Studiengangleiters mit einem Mitglied des Schützenvereins kann eine interkul- 
turelle Erfahrung sein. Sobald Menschen sich gegenseitig als ‚fremd‘ erleben, 
findet ‚Interkulturelle Kommunikation‘ statt“ (2020: 4). 

Kann eine Sprachlern-App jedoch gewährleisten, dass die erlernbaren 
Teilbereiche der interkulturellen Kompetenz abgedeckt und vermittelt wer- 
den? Ein Merkmal des M-Learnings, welches zuvor erläutert wurde, ist das 
eigenständige und ortsunabhängige Lernen: So sind die Nutzer der App, die 
ohne Lehrkraft oder andere Mitlernendem arbeiten, mit denen interkulturelle 
Kompetenz vermittelt und thematisiert werden kann, auf sich alleine gestellt. 
Hierbei stellt sich also die Frage, durch welche Mittel eine Applikation Lernen- 
de für interkulturelle Unterschiede sensibilisieren kann und ob diese auch ohne 
den entsprechenden Austausch mit einer Lehrkraft oder anderen Lernenden 
ausreichend reflektiert wird. Um dieser Frage weiter nachzugehen, wird im 
folgenden Abschnitt die bisherige Forschung zur interkulturellen Kompetenz- 
vermittlung in Apps skizziert. 
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2.1 Interkulturelle Kompetenz in Sprachlern-Apps 


Mit der Popularität von Apps zum Fremdspracherwerb wächst auch die For- 
schungsarbeit auf diesem Gebiet. Rosell-Aguilar (2018: 5) weist jedoch hierbei 
daraufhin, dass sich die meisten Studien auf die Verwendung von Apps im oder 
neben dem Spracherwerb im Unterricht beziehen. Auf der Suche nach kon- 
kreten Studien oder Leitfragen zur Evaluation von Sprachlern-Apps außerhalb 
von Unterrichtssituationen findet man hauptsächlich in der englischsprachi- 
gen Literatur einige Ansätze (vgl. Rosell-Aguilar 2017, Chen 2016). Hierbei 
gehen Wissenschaftler/innen auf verschiedene Aspekte der Apps ein. So wer- 
den zum Beispiel das Feedback und die Motivation fiir Lernende durch diese 
Anwendungen untersucht (so in Chen 2016) oder aber die Nutzung digitaler 
Anwendung für die Verbesserung bzw. Korrektur verschiedener Fertigkeiten 
(vgl. Lai & Zheng 2017). 

Rosell-Aguilar (2017) bietet hierfür einen detaillierten Kriterienkatalog zur 
umfassenderen Analyse und Evaluation von Apps. Hierbei geht er auffolgende 
Faktoren ein: Technology, Pedagogy, Language Learning und User Experience 
(vgl. ebd.: 14). Für den vorliegenden Beitrag interessant ist vor allem die Kate- 
gorie Language Learning, die in Abb. 1 dargestellt wird: 


Language learning 


* Pronunciation and intonation: does the 

* Reading: does the app provide texts in app offer specific activities for 
the target language? pronunciation and intonation? 

* Listening: does the app provide audio in || * Cultural information: does the app 
the target language? include information about customs and 

a Writing: does the app offer traditions in the areas where the language 
opportunities to write in the target is spoken? 
language? * Use of visual content: are images and 

* Speaking: does the app offer videos stereotypical or stock images? Do 
opportunities to speak in the target they represent the diversity of the areas 
language? where the language is spoken? 

* Vocabulary: does the app offer specific ||" Language varieties: does the app 
activities for vocabulary acquisition? include different regional or national 

* Grammar: does the app offer specific varieties of the language? 
activities for grammar practise? 


Abb. 1: Language Learning (Rosell-Aguilar 2017: 14) 
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Mit den Punkten „Cultural information’, „Use of visual content“ und „Lan- 
guage varieties“ geht der Autor auf Faktoren ein, die zum Erlangen der inter- 
kulturellen Kompetenz beitragen. Hierbei bieten die verwendeten Aspekte 
jedoch eine große Spannbreite, da der Autor sich auf eine generelle Evalua- 
tion der App bezieht. Möchte man jedoch der Frage nachgehen, inwieweit 
interkulturelle Kompetenz vermittelt werden kann, so bietet es sich an, die 
Aspekte Rosell-Aguilars (2017) weiter zu vertiefen. Besonders im ersten Punkt 
„Cultural information“ wird sichtbar, dass der Autor auf die Informations- 
vermittlung eingeht, welche, wie in den vorherigen Abschnitten besprochen, 
vor allem der landeskundlichen Komponente der interkulturellen Kompetenz 
zugeschrieben werden kann. Der nächste Punkt „Use ofvisual content“ ist für 
die Untersuchung dahingehend interessant, da durch die Verwendung von 
Bildern und Videos eine Sensibilisierung der Lernenden stattfinden kann. Der 
Einsatz von Fotos und Bildern kann im Rahmen des Erlangens interkultureller 
Kompetenz verschiedene Funktionen haben. So eignen sich Bilder „aufgrund 
ihrer komprimierten Darstellung von Sichtweisen über die fremde und die ei- 
gene Kultur zur Sensibilisierung für wechselseitige Stereotype“ (Usener 2016: 
48). Sie erlauben aber auch einen Einblick in das Alltagsleben der Zielkultur 
(vgl. ebd.: 51) und werden so „als Träger soziokulturellen Orientierungswis- 
sens“ wahrgenommen (vgl. ebd.: 96). Darüber hinaus können Bilder auch 
Identifikationsmöglichkeiten anbieten. Solche helfen den Lernenden „zu einer 
Identifikation mit fremdsprachlichen Unterrichtsinhalten, also u.a. zielkultu- 
rellen Werten und Verhaltensweisen“ (Hecke 2010: 100) zu gelangen. Durch 
diese Identifikation wird Empathie hervorgerufen, die die Lernenden dem 
interkulturellen Verständnis näher führt (vgl. ebd. 2010: 101). Dies geschieht, 
wenn es den Lernenden gelingt, sich in andere Rollen hineinzuversetzen, sich 
der eigenen kulturellen Identität bewusst zu werden - somit haben Bilder 
ein hohes Emotionspotenzial (vgl. Biechele 2006: 20). Laut Usener (2016: 
93) bietet es sich hierbei auch an, „den Lernern Figuren zu präsentieren, 
die auf authentischen Fotos abgebildet sind und demzufolge auch realiter 
existieren“. Sollen Bilder nicht explizit dafür genutzt werden, Stereotype zu 
thematisieren, ist es nach Hecke (2010: 93) außerdem ratsam, verschiedene 
Bilder zu benutzen, um die Entstehung von Stereotypen zu vermeiden. Bie- 
chele (2006: 32) regt im Zusammenhang von interkulturellen Kompetenzen 
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und Bildfunktionen zur Nutzung von authentischen Bildern an. Diese bieten 
eine „‚doppelte Offenheit‘, eine, die auf der Polyvalenz von Bildern beruht, 
und eine, die der fremdkulturell geprägte Betrachter in seine Interpretation 
einbringt“ (ebd.: 36). 

Auch mit der Frage „Does the app include different regional or national 
varieties of the language?“ geht Rosell-Aguilar (2017: 14) auf einen wichtigen 
Punkt der interkulturellen Kompetenz ein. Bei der Auswertung werden nicht 
nur Dialekte, sondern zum Beispiel auch Jugendsprache beachtet, welche In- 
dikatoren für Multikollektivität sein können. Somit werden Lernende nicht 
nur mit den verschiedenen Sprachvarianten vertraut gemacht, sondern auch 
für Unterschiede sensibilisiert. 

Werden von Rosell-Aguilar (2017) somit schon relevante Ansätze zur 
Evaluation berücksichtigt, bleibt jedoch die Frage offen, ob eine Sprach- 
lern-App auch in anderen Bereichen zur Vermittlung interkultureller Kom- 
petenz beitragen kann. Wie vom Autor festgestellt, können sich Apps in ihrer 
Gestalt sehr voneinander unterscheiden, sodass fraglich ist, welche Aspekte für 
die Sensibilisierung interkultureller Unterschiede erwartet werden können. Es 
bietet sich bei der Erstellung eines Fragenkatalogs also an, auch ähnliche bzw. 
bereits bekannte „Hilfsmittel“ des Sprachenlernens miteinzubeziehen und zu 
untersuchen, weshalb nachfolgend auf Elemente der Lehrwerksanalyse ein- 
gegangen wird. 


2.2 Interkulturelle Kompetenz in Lehrwerken 


Stellen Apps ein neueres Medium dar, welches zum Erlernen einer Fremdspra- 
che genutzt wird, hat das Lernen mit analogem Lernmaterial hingegen eine lan- 
ge Tradition (vgl. Ciepielewska-Kaczmarek et al. 2020: 19). Im Gegensatz zur 
App gibt es nicht nur in der Fremdsprachendidaktik allgemein, sondern auch 
speziell in Deutsch als Fremdsprache ein gut ausgebautes Forschungsgebiet 
zur Analyse von Lehrwerken. Auch die Landeskunde und die interkulturelle 
Kompetenz finden in diesem Feld Beachtung. Wie zuvor gezeigt, kann die 
Vermittlung von landeskundlichen Fakten als ein erster Schritt zum Erlan- 
gen interkultureller Kompetenz gesehen werden und stellt dabei einen Teilbe- 
reich der kognitiven Komponente dieser dar (vgl. Fuchs 2012: 50). Auch wenn 
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Sprachlern-Apps nur bedingt mit Lehrwerken aus dem Fremdsprachenunter- 
richt vergleichbar sind, kénnen die Kriterienkataloge, mit denen Lehrwerke 
analysiert werden, ebenfalls erste Anhaltspunkte für eine genauere Analyse 
zum M-Learning bieten. 

Es finden sich verschiedene Ansätze, wie bspw. bei Ciepielewska-Kacz- 
marek et al. (2020), die verschiedene Lehrwerke anhand von Leitfragen zu 
landeskundlichen Inhalten analysieren. Hierbei untersuchen die Autorin- 
nen zunächst, ob landeskundliche Themen explizit oder implizit behandelt 
werden bzw. ob diese als landeskundliche Themen ausgezeichnet sind (vgl. 
Ciepielewska-Kaczmarek et al. 2020: 77). Des Weiteren wird ausgewertet, ob 
Landeskunde additiv, isoliert bzw. integrativ dargeboten wird. Ist sie integrativ, 
wird sie mit sprachlichen Inhalten „verknüpft angeboten [...], wobei in den 
Aufgaben sprachliche und kulturelle Aspekte ‚gleichberechtigt‘ vertreten sind“ 
(ebd.). Als isoliert wird eine landeskundliche Einheit bezeichnet, wenn sie 
weder mit sprachlichen Aufgaben verbunden ist noch inhaltlich zur Einheit 
passt (vgl. ebd.). Als letzte Option sehen die Autorinnen die additive Lan- 
deskundevermittlung, in der „ein vorgestelltes landeskundliches Phänomen 
zum Thema der Einheit passt, aber nicht mit sprachlichen Inhalten verbunden 
ist“ (ebd.). Ferner wird untersucht, inwieweit Bilder und Videos verwendet 
werden, ob ein Bezug zur Lebenswelt der Lernenden hergestellt wird und „ob 
die Aufgaben die Möglichkeit bieten, die ausgangs- und zielsprachige Um- 
gebung zu entdecken und das Herstellen von Verbindungen zwischen bei- 
den ermöglicht‘, „eine kulturreflexive Haltung fördert“ und „den Lernenden 
ermöglichen, am zielsprachigen Diskurs teilzunehmen“ (ebd.: 78). Auch die 
Beachtung des DACH-Prinzips', welches besagt, dass nicht nur Deutschland, 
sondern der weitere deutschsprachige Raum - hier Deutschland, die Schweiz 
und Österreich - und dessen kulturelle und sprachliche Vielfalt behandelt wird, 
wird untersucht (vgl. ebd.). 


1 Wird das DACHL-Konzept (also mit Berücksichtigung Liechtensteins) bei den Autoren an- 
gesprochen, liegt der Augenmerk der Untersuchung bei Ciepielewska-Kaczmarek u.a. 2020 
(77) auf dem DACH-Konzept. 
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Liegt der Schwerpunkt dort auf landeskundlichen Elementen, geht Use- 
ner (2016: 89) auf die interkulturelle Kompetenz selbst ein und stellt einen 
ausformulierten detaillierten Kriterienkatalog zusammen, der 20 Fragen zur 
interkulturellen Kompetenz in Lehrwerken enthält: 


A Zur Stellung interkulturellen Lernens: 


1. Verweist das Inhaltsverzeichnis des Schülerbuchs bzw. der Lek- 
tionsauftakt auf interkulturelles Lernen als zentral zu erlernende 
Fertigkeit? 

2. Weisen sowohl obligatorische als auch fakultative Lektionen und 
Lektionsteile interkulturelles Potenzial hinsichtlich ihrer Themen 
und Verfahren auf? 

3. Werden Formen der Überprüfung interkultureller Kompetenz bzw. 
einzelner Teilkomponenten vorgeschlagen (z.B. Selbstevaluation)? 


B Zur Förderung der affektiv-attitudinalen Dimension (savoir étre): 


4. Werden Lernerorientierung und Lebensweltbezug durch Themen-, 
Material- sowie Aufgaben- und Methodenauswahl deutlich? 

5. Haben die Lernenden die Möglichkeit, sich mit den Lehrwerkfigu- 
ren zu identifizieren? 

6. Werden Begegnungen mit der Fremdkultur bzw. Begegnungen ei- 
nander fremder Kulturen thematisiert? 

7. Werden critical incidents thematisiert und analysiert? 

8. Werden stereotype Vorstellungen und Bilder gegenüber den Ziel- 
kultur(en) bzw. der Eigenkultur thematisiert und reflektiert? 

9. Wird zur Hypothesenbildung zu Bildern und Texten sowie darin 
enthaltenen Handlungsabläufen und Verhaltensmustern angeregt? 

10. Werden die Lernenden dazu angeregt, einen Perspektivwechsel zu 
vollziehen? 
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C Zur Förderung der kognitiv-analytischen Dimension (savoir): 


11. Werden authentische Materialien (z.B. literarische Texte, Werbean- 
zeigen, Lieder, Fotos) als Wissenszugang zur fremdkulturellen Welt 
genutzt? 

12. Wird soziokulturelles Orientierungswissen über Eigen- und Fremd- 
kultur vermittelt bzw. thematisiert? 

13. Wird allgemeines Wissen über Kultur und Kommunikation vermit- 
telt? 

14. Werden die kulturspezifische Prägung einzelner Begriffe und Be- 
griffsfelder sowie kulturspezifische Konventionen des Kommuni- 
zierens verdeutlicht? 

15. Werden intrakulturelle Unterschiede und transkulturelle Phänome- 
ne der Zielkultur(en) thematisiert? 

16. Wird zum Kulturvergleich, insbesondere zum Vergleichen und 
Kontrastieren von Alltagssituationen, angeregt? 


D Zur Förderung der handlungsorientierten Dimension (savoir faire): 


17. Wird der Umgang mit nonverbalen Kommunikationsmitteln the- 
matisiert und eingeübt? 

18. Werden handlungsrelevante Verfahren des Rollenspiels zur Bewäl- 
tigung interkultureller Begegnungssituationen vorgeschlagen? 

19. Werden ganzheitliche Lernarrangements zum Eintauchen in den 
zielkulturellen Kontext (komplexe Lernaufgaben, Unterrichtspro- 
jekte, simulation globale) vorgeschlagen? 

20. Wird auf virtuelle Begegnungssituationen mit der Zielkultur hin- 
gewirkt? 


Können einige der genannten Untersuchungsfragen für Lehrwerke auch auf 
Apps übertragen werden, so gestaltet sich dies für andere Schwerpunkte eher 
schwierig. Gibt es bei einem Lehrwerk in der Regel ein Inhaltsverzeichnis, so 
können Apps verschiedene Formen und Aufbauweisen haben, welche nicht 
zwingend ein transparentes Inhaltsverzeichnis aufweisen müssen, sodass es 
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bereits beim ersten Punkt zu Vergleichsschwierigkeiten kommen kann. In- 
wieweit eine App zum Einüben nonverbaler Kommunikationsmittel (Punkt 
17) verhelfen kann, bleibt eher fraglich, genauso ist ein Unterrichtsprojekt mit 
zielkulturellem Kontext (Punkt 19) nicht möglich, da M-Learning gesondert 
vom Unterricht verwendet wird. So verlangen auch die Punkte 7 und 18 eine 
Thematisierung oder Einübung im Kurs - dies kann eine App nicht bieten. 
Auch Punkte 9 und 10 sind in einer App nicht zu erwarten, da die Bearbeitung 
bzw. Auswertung eher auf eine Diskussion/Reflexion im Kurs ausgelegt ist und 
eine App keine (offensichtliche) Möglichkeit zur Rückmeldung bietet. Auch 
der Zeit- Aspekt spielt bei vielen Punkten eine Rolle und ist für die vorliegende 
Arbeit erforderlich: Wie bereits beschrieben, ist ein zentrales Merkmal des 
M-Learnings auch der kurze Zeitrahmen einer Lektion. Hierbei stellt sich die 
Frage, ob in kurzen Einheiten ein Einbezug von beispielsweise (Lehrwerk-) 
Figuren zur Identifikation möglich ist oder aber ob verschiedene authentische 
Materialien, z.B. literarische Texte oder Lieder (Punkt 11) herangezogen wer- 
den. Insgesamt ergibt die Recherche zu Sprachlern-Apps nur wenig Aufschluss 
darüber, welche Textformen in diesen verwendet werden. Scheint die Bearbei- 
tung langer literarischer Texte im Kontext des Lernens in kleinen Einheiten 
als eher unwahrscheinlich, wird von den Anbietern selbst der Dialog in den 
Fokus gestellt. So wirbt Babbel mit „interaktiven Dialogen zu alltäglichen Si- 
tuationen“ und Busuu verspricht Lernen „mit einer Kombination aus unseren 
Al-gestiitzten Ausspracheübungen und Dialogen, die von unseren Linguisten 
entwickelt wurden“. 

Behandelt Usener (2016: 53) die Einübung dialogischer Sprachkompeten- 
zen durch Rollenspiele, wird im Fragenkatalog nicht weiter auf die Bedeutung 
von schriftlich festgehaltenen Dialogen für die Ausbildung der interkulturellen 
Kompetenz eingegangen. Dialoge haben sich jedoch in den letzten Jahren zu 
einem vielversprechenden Forschungsgegenstand innerhalb der interkulturel- 
len Kommunikation entwickelt, sodass diese im nächsten Abschnitt behandelt 
werden, um eine weitere Grundlage zur Evaluation von Sprachlern-Apps zu 
bieten. 
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2.3 Dialogisches Handlungsspiel 


In den letzten Jahren hat sich der Fokus der Pragmatik von der Untersuchung 
von monologischen Sprechakten zur Forschung an Dialogen verschoben. So 
wird heutzutage angenommen, dass die kleinste kommunikative Einheit ein 
Handlungsspiel aus Aktion und Reaktion ist (vgl. Grein 2019: 130), was im 
minimal action game Modell nach Weigand (2010) diskutiert wird. Ausgangs- 
punkt des Modells ist es nicht nur, die Aktion der/des Sprechenden und die 
Reaktion der/des Horenden als Einheit zu betrachten, sondern auch den Men- 
schen als Individuum mit all seinen Bedürfnissen, Wünschen und Fähigkeiten, 
Emotionen und sozialen Hintergründen zu sehen. Basierend auf dieser An- 
sicht ist davon auszugehen, dass keine Kommunikation ohne Grund zustande 
kommt, auch wenn diese nur bewirkt, dass Beziehungen durch beispielsweise 
Small-Talk gestärkt oder aufgebaut werden, denn „[s]peech, cognition, percep- 
tion and having emotions interact“ (Grein 2018: 67). 

Damit eine Konversation gelingen kann, muss der/die zweite Gesprächs- 
partner/in also nicht nur die Äußerung der/des ersten mit einbeziehen: Hier 


spielt neben der Situation (die auch wieder unterschiedlich wahrge- 
nommen werden kann) auch die Persönlichkeit und die mit der Situa- 
tion einhergehenden Emotionen eine Rolle. Menschen haben divergie- 
rende Einschätzungen und Wertungen von ein und derselben Situation 
(Grein 2019: 131). 


Bezüglich dieser dialogischen Kommunikation bestehen Prinzipien, die of- 
fenbaren, wie das Handlungsspiel (active and reactive speech act) aufgebaut 
ist, jedoch keine festgelegten Regeln (vgl. ebd.). Diese Prinzipien sind von 
verschiedenen Faktoren geprägt und somit stark vom einzelnen Individuum 
abhängig, da hier „individual imprint“, „cultural imprint“, „perception & cog- 
nition’, „emotions“ und „principles of language use“ der Gesprachsteilnehmen- 
den einfließen (Grein 2018: 86). Die Berücksichtigung der Gesprächsteilneh- 
menden in ihrer Gesamtheit als Mensch macht dieses holistisch-dialogische 
Modell aus (vgl. ebd.: 67). Prinzipien sind das Action Principle (AP), welches 
besagt, dass eine Äußerung einen kommunikativen Zweck beinhaltet und das 
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Dialogical Principle (DP) demzufolge Kommunikation auf dialogischen Akti- 
onen beruht, welche aufeinander aufbauen (vgl. ebd.: 68). Dabei ist das „kom- 
munikative Ziel eines jeden Handlungsspiels (oder auch jeden Dialoges) [...] 
zu einem gemeinsamen Verstehen und einer Verständigung (understanding) “ 
zu kommen (Grein 2019: 131) Dies erreichen Personen vielmehr durch deren 
kognitiven Hintergrund und deren Wissen, als durch explizite Aussagen, da 
„coherence is no longer in the text, it is given by the interlocutors“ (Weigand 
2009: 160, zit. in Grein 2018: 68). 

Wird der Mensch durch das Modell in seiner Ganzheit gesehen, ist seine 
kulturelle Pragung Teil dieser Ganzheit, sodass Action Games in verschiede- 
nen Kulturen von verschiedenen Menschen äußerst unterschiedlich ausge- 
tragen werden können. So kann es in (interkulturellen) Kommunikationssi- 
tuationen zu Missverständnissen kommen, welche bei „kulturdivergierenden 
Sprechenden zunächst wahrscheinlicher als bei Sprecherinnen und Sprechern 
einer Kultur“ (Grein 2019: 131) sind. Diese Feststellungen spielen eine bedeu- 
tende Rolle für die interkulturelle Kompetenz und kommt Lernenden einer 
Fremdsprache zu Hilfe, da der authentische Spracherwerb und -gebrauch 
unter Beachtung der Forschungsergebnisse effektiv gefördert werden kann. 
Dies kann durch die Integration von minimal action games in Lehrwerken 
und durch Erklärung zur Unterschiedlichkeit von Äußerungen infolge sozi- 
okultureller Hintergründe in der Zielsprache erreicht werden (Grein 2018: 
68, ebenso Grein 2019: 132). 

Grein (2018) zeigt dies an modernen Lehrwerken für Deutsch als Fremd- 
sprache auf und verweist auf die kulturell bedingte Andersartigkeit von Dia- 
logen, welche schon bei kurzen Sequenzen festgestellt werden kann. Je nach 
kultureller Prägung können schon kurze Sprechakte, wie eine Begrüßung, 
bemerkliche Unterschiede aufweisen. Beginnt ein Italiener eine Unterhaltung 
mit einer flüchtig Bekannten mit „Ciao Bella“; kann diese Anrede „Hallo Schö- 
ne“ bei einer Deutschen bereits anzüglich wirken. Durch das Aufzeigen au- 
thentischer Dialoge, welche nicht nach Regeln, sondern Prinzipien aufgebaut 
werden, lernen Lernende hier schon in niedrigen Niveaustufen verschiedene 
Dialogmodelle kennen. So zeigt die Autorin, wie beispielsweise mehrere Op- 
tionen zur Vorstellung gegeben werden, die im Deutschen alle angemessen, 
direkt übersetzt in anderen Sprachen jedoch nicht unbedingt authentisch sind. 
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Die dargestellten Dialoge sind somit Beispiele fiir Kommunikationssituati- 
onen in der Fremdsprache - durch ihre Einbettung können Lernende jedoch 
noch mehr Wissen erwerben. So sind diese minimal action games häufig „sup- 
ported by pictures or movie clips“ (Grein 2018: 72). Durch diese können Ler- 
nende auch nonverbale Signale beobachten und dabei „often indirectly, help 
learners to become aware of cultural differences, i.e. pictures demonstrating 
gender equality in Germany, the appropriate talking distance, eye contact, the 
display of emotions and frequency of touch“ (ebd.). 

Ob und wie Dialoge nicht nur in Lehrwerken, sondern auch in Apps zur 
Ausbildung der interkulturellen Kompetenz beitragen und wie sich die in den 
letzten Abschnitten gesammelten Themenbereiche in einem Kriterienkatalog 
sammeln lassen, wird im nächsten Abschnitt behandelt. 


3 Interkulturelle Kompetenz in Lern-Apps 


Im vorherigen Abschnitt wurden Forschungsfragen aus der Lehrwerkanalyse 
wie auch der App-Evaluation behandelt, welche hier zusammengefasst Leitfra- 
gen für den praktischen Teil dieser Arbeit liefern. Ein vollständig ausformulier- 
ter Fragenkatalog wurde für diese Untersuchung als nicht sinnvoll betrachtet, 
da Lernapps sich in ihrer Form und im Aufbau stark voneinander unterschei- 
den können und deshalb, wie bereits erwähnt, nur bedingt vergleichbar sind 
(vgl. Godwin-Jones 2017: 6). Die folgenden Untersuchungsfelder können je- 
doch in Sprachlern-Apps erwartet und behandelt werden und bieten verschie- 
dene Möglichkeiten, Lernenden interkulturelle Kompetenz nahe zu bringen. 
Die drei Apps Babbel, Duolingo und Busuu werden hierbei auf folgende Be- 
standteile untersucht: 


e Landeskundliche Inhalte (Fachwissensvermittlung)? 
« Language variety und intrakulturelle Unterschiede sowie DACH-Ansatz’ 


2 Basierend auf Ciepielewska-Kaczmarek u. a. (2020: 77), Usener (2016: 90), Rosell-Aguilar 
(2017: 14). 


3 Basierend auf Ciepielewska-Kaczmarek u. a. (2020: 77), Rosell-Aguilar (2017: 14). 
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e Minimal action games (authentische Dialoge)‘ 
e Videos und Bilder (nonverbale und paraverbale Elemente)’ 


Können die hier genannten vier Themengebiete erwartet werden, werden wei- 
tere, wie etwa die von Usener (2016) genannten Punkte zur interkulturellen 
Kompetenz, ebenfalls beachtet, falls sich diese oder nur Ansätze dieser in den 
Apps finden lassen. Außerdem wird desgleichen in Betracht gezogen, inwieweit 
auf kulturelle Einheiten hingewiesen wird (vgl. Usener 2016: 53 und Ciepie- 
lewska-Kaczmarek et al. 2020: 77) bzw. ob diese in eine Lerneinheit integriert 
oder gesondert vermittelt werden. 

Um die einzelnen Apps mit ihrer Ganzheit an Funktionen vergleichbar 
zu machen, wird zunächst der Start der App (also die ersten Schritte) sowie 
der Aufbau und das Inhaltsverzeichnis analysiert sowie Zusatzfunktionen, die 
außerhalb der abgegrenzten Aufgabenfelder verfügbar sind (Zusatzkurse und 
„Bonus Skills“). Um interkulturelle Inhalte innerhalb einer Lektion vergleichen 
zu können, wurde sich auf die ersten Lektionen der Apps beschränkt, welche 
dem Niveau Al zuzuordnen sind. Um hier auch thematisch Vergleiche her- 
stellen zu können, werden die Lektionen zum Thema „sich vorstellen“ bzw. 
„Essen/Essen gehen“ genauer untersucht, da diese Themenfelder frühzeitig 
vermittelt werden. 

Die zu untersuchenden Sprachlern- Apps sind die mit am häufigsten herun- 
tergeladenen Anwendungen (jeweils über 10 Millionen Downloads im Google 
PlayStore) und wurden von der Deutschen Gesellschaft von Verbraucherstu- 
dien mbH (DtGV) 2018 in der Studie „Sprachlernportale: Angebot & Preise, 
Lernspaß, Lernkomfort, Transparenz, Umfang der App“ mit weiteren vier Apps 
getestet. Hierbei wurde Busuu mit 85% Testsieger (2,0 | Gut), Babbel erreichte 
Platz 2 (84%, 2,1 | Gut) und Duolingo wurde Dritter (79%, 2,4 | Gut) (dtgv.de). 

Die Installation und einige Lektionen sind kostenfrei, eine Premiumversion 
wird von allen drei Apps angeboten, auf die sich die folgende Untersuchung 
bezieht. Die Ausgangssprache, welche bei allen drei Anwendungen verwendet 
wurde, ist Englisch. 

4 Basierend auf Grein (2017: 72, 2019), Usener (2016: 53). 
5 Basierend auf Grein (2017: 72), Usener (2016: 53), Rosell-Aguilar (2017: 14). 
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3.1 Babbel 


Gleich zum Start des Programms wird der/dem Lernenden die Frage gestellt, 
warum sie/er Deutsch lernen möchte; hier stehen die Unterpunkte „Travel“; 
„Career“, „Hobby“, „For friends and family“, „Im planning to move“ oder 
„mental workout“ zur Auswahl. Die vorgeschlagenen Lektionen zu unter- 
schiedlichen Niveau-Stufen zeigen einen lebensnahen Ansatz der App, klickt 
man beispielsweise auf „I’m planning to move“ schlägt die App Kurse auf B2 
Niveau zu verschiedenen Dialekten vor. 

Beginnt man mit der niedrigsten Niveaustufe, wird die erste Stufe „New- 
comer“ in verschiedene Kurse und „lessons“ aufgeteilt, die Titel wie z.B. „Hallo, 
wie geht's dir? Part 1“ tragen. Zunächst gibt es innerhalb des Inhaltsverzeich- 
nisses keine Kennzeichnung interkultureller/landeskundlicher Themenbereiche. 
Gleich zu Beginn der ersten Lektion wird die Figur Freddy vorgestellt: Freddy „is 
an English journalist. He's just moved to Berlin. Join him and learn German!“ Mit 
diesem Charakter, mit dem die Lernenden sich identifizieren können, beginnt 
die erste Lektion, in der Begrüßung und Vorstellung eingeübt wird. Bereits in 
dieser ersten Lektion werden sprachliche Variationen angeboten und verschiede- 
ne Optionen zur Begrüßung aufgezeigt wie „Hi, Hey or Na?“ (Babbel Lektion 1, 
Hallo, wie geht's dir?). Die Lektion endet direkt mit einem ersten Dialog, in dem 
die ersten gelernten Sequenzen eingeübt werden. Hier wird die Rahmensituation 
beschrieben (Freddy zieht nach Berlin), sodass gleich der erste Dialog eine au- 
thentische Handlung mit begrenztem Wortschatz aufweist und somit ein Beispiel 
für ein erstes dialogisches Handlungsspiel stellt: 


Freddy is staying with a family friend until he finds his own place. He's 
introducing himself to his host... 

> Hallo, ich bin Freddy 

> Hallo Freddy. Ich bin Maria. 

> Wie gehts dir? 

> Mir gehts gut, danke. Und dir? 

> Mir gehts auch gut. 

> Willkommen in Berlin! Komm, ich zeige dir dein Zimmer. 

> Danke. 
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Werden die Dialoge selbst nicht mit Bildern unterstützt, wie beispielsweise 
in Lehrwerken (vgl. Grein 2018), so benutzt Babbel zur Einführung aller Vo- 
kabeln Fotos (Abb. 2), die Lernende nicht nur beim Einprägen der Vokabeln 
unterstützen, sondern auch einen ersten Eindruck in den deutschen Sprach- 
raum vermitteln: 


Abb. 2: Personalpronomen und langes „i“ (Original in Farbe) 


Listen and repeat: the long i 
fe, 


ap Wie geht es Ihnen? 


Die abgebildeten Personen zeigen verschiedene Charakter, aus Gruppen ver- 
schiedenen Alters, Genders und Ethnizitat und vermitteln dadurch ein ,,bun- 
tes“ Deutschlandbild, welches verschiedene soziale Gefüge präsentiert und 
die Lernenden somit für intrakulturelle Unterschiede und Multikollektivität 
sensibilisieren kann. Diese Sensibilisierung durch Bilder findet auch dann statt, 
wenn andere Themenbereiche der Sprache im Fokus stehen. So wird in einem 
ersten Aussprachetraining das lange „i“ eingeübt, mit dem präsentierten Bild 
sehen die Lernenden jedoch auch, wie man sich im deutschsprachigen Raum 
im formellen Kontext begrüßt und werden hier für Distanzverständnis und 
Körperhaltung sensibilisiert. 

Diese visuelle Einführung in kulturelle Begebenheiten setzt Babbel fort, 
indem nicht nur Bilder, sondern zusätzlich auch Videos angeboten werden 
(siehe Abb. 3). Gleich in der ersten Lern-Stufe werden in der Web-Version 
insgesamt drei Video-Lektionen als Zusatzmaterial angeboten. Hier wird ein 
weiterer Charakter eingeführt: Julia aus Minnesota, die ebenfalls nach Berlin 
zieht. In den amüsant gestalteten Videos werden Alltagssituationen gezeigt, in 
denen gelernte Vokabeln, Grammatikregeln und ähnliches wiederholt werden. 
Durch Julia gibt es hier somit auch einen weiteren Charakter, mit dem sich die 
Lernenden identifizieren können. Im Gegensatz zu Freddy ist Julia weiblich und 
Amerikanerin, wodurch weitere Lernendengruppen eine Bezugsperson finden. 
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| Ich bin Peter. 


Abb. 3: Video „Sorry and beyond“ (Original in Farbe) 


Die gedrehten Szenen (auf der Straße, im Treppenhaus) erlauben Lernenden 
Rückschlüsse auf das Leben in Berlin und auch hier können kulturelle Eigen- 
schaften wie Distanzverhalten oder Mimik und Gestik beobachtet werden. 
Auch die hier gezeigten Dialoge zwischen deutschen Muttersprachler/innen 
untereinander oder mit Julia stellen authentische und lebensnahe Dialogsitu- 
ationen dar. 

Des Weiteren erlauben diese Szenen auch eine anschauliche Vermittlung 
von Fachwissen bzw. landeskundlichen Inhalten. Hier wird zum Beispiel die 
„Sonntagsruhe“ thematisiert, sodass kulturspezifische Phänomene und Be- 
griffsfelder angesprochen werden (vgl. Usener 2016). Julias Nachbar klopft an 
der Tür und beschwert sich über den Krach beim Einzug am Sonntag, bevor er 
wieder geht. Julias deutsche Freundin erklärt ihr diesen Critical Incident und 
sie bereiten zusammen eine Entschuldigung vor, sodass hier die sprachlichen 
mit den landeskundlichen Besonderheiten verbunden werden und den Ler- 
nenden hierdurch alltagsnahe Situationen nähergebracht werden. 

Der Aufbau aus Wortschatzeinführung, Einüben und alltagsnahen Dialo- 
gen bleibt bei allen Themen erhalten, sodass neu eingeführte Worte/Sequenzen 
zunächst einzeln präsentiert werden und dann im Kontext verwendet werden. 
Auch beim zweiten untersuchten Thema „Essen und Trinken“ bzw. „Restau- 
rantbesuch“ sind die Dialoge authentisch und abwechslungsreich konzipiert 
und in den Videosequenzen werden verschiedene Szenarien eines Dialogs in 
einem Café behandelt , sodass Lernende mit einer Auswahl an Sprachmitteln 
vertraut gemacht werden, also authentische minimal action games präsentiert 
bekommen: So werden hier ,,Soll’s noch was dazu sein?“, „Sonst noch was?“ 
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und „Ist das alles?“ als Fragen eines/einer Bäckereiverkäufers/-verkäuferin 
eingeführt. 

In der Lektion selbst erfolgen außerdem Erklärungen zu landeskundli- 
chen Themen, in diesem Fall beispielsweise zum Trinkgeld. Hierbei wird die 
landeskundliche Fachwissensvermittlung mit den neu erlernten sprachlichen 
Mitteln verknüpft: 


Paying and tipping 
In Germany it is very common to split the bill. You'll usually be asked: 
Zusammen oder getrennt? Together or separate? 


If you want to pay separately, you answer: 

Getrennt bitte! Separate please! 

Its common to leave a tip of around 10%. If you wanna tell the server to 
keep the change, you simply say 

Stimmt so. Keep the change (lit. It’s correct like this). 

(Babbel: Lesson 9: Was möchten Sie? Part 2 Paying and tipping) 


Verweist der Titel „Paying and tipping“ zwar auf eine alltägliche Situation, ist 
diese kurze Einheit aber nicht explizit als interkultureller oder landeskundli- 
cher Einschub gekennzeichnet. Viel mehr fließen diese Erklärungen - sei es 
schriftlich festgehalten oder im Video besprochen - in die einzelnen Lektionen 
mit ein, so auch in der Videolektion, in der thematisiert wird, dass Cafes und 
kleinere Läden nicht unbedingt Kreditkarten akzeptieren, sondern hier bar 
bezahlt wird. 

Auch regionale Besonderheiten lassen sich innerhalb der Lektionen finden. 
Behandeln die Lernenden zum Beispiel weiter das Thema „Essen“, werden bei 
einem Restaurantbesuch in Stuttgart regionale Spezialitäten wie die schwäbi- 
schen Käsespätzle thematisiert. Mit Bildern und landestypischen Gerichten 
wird den Lernenden die „deutsche Küche“ nähergebracht. Das Thema „Essen“ 
bleibt jedoch nicht auf die deutsche Küche beschränkt: Durch Beispiele wie 
„Sushi essen gehen“ präsentiert die App auch andere Küchen, die durchaus im 
deutschsprachigen Raum beliebt sind. Landeskundliche/interkulturelle The- 
men werden hierbei implizit und integrativ behandelt, also mit dem Thema 
der Einheit verknüpft. 
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Ferner findet sich unter der Kategorie „more courses“ eine Einheit zu Län- 
dern und Traditionen, die explizit als solche bezeichnet wird: „Countries and 
Traditions. In these courses, you won't just learn the language. You'll also gain 
useful knowledge about Germany.“ Innerhalb dieser Kategorie können Lernen- 
de beispielsweise Dialekte des Deutschen kennenlernen: Hierbei gibt es eine 
Auswahl aus Berlinerisch, Hessisch, Oberfränkisch, Schwäbisch, Sächsisch, 
Plattdeutsch und Bayerisch. Es wird erklärt „Ihe Bavarian dialect is spoken 
in Southern Germany, in the area around Munich and also in some parts of 
Austria“, weitere DACH-relevante Dialekte werden jedoch nicht vermittelt. 
Innerhalb der verschiedenen Sonder-Lektionen wird nicht nur auf dialekti- 
sche Bezeichnungen eingegangen, sondern auch landeskundliches Fachwissen 
vermittelt. Als Beispiel erfolgt die Vermittlung und Erklärung des „Spätis“ in 
Berlin: 


No Berlin without a Späti 

Often, colloquial expressions are ofregional origin, such as the Späti which 
is actually short for Spätkauf and literally means late-purchase. 

As Spätis originated in the former GDR to supply shift workers, you find 
them mostly in Berlin and east Germany.Fun fact: Legally, shops in Ger- 
many are not allowed to sell goods on Sundays. So, technically, Spätis are 
violating the law. 

> Lass uns mal zum Späti gehen und noch ein Bier holen! 

(Babbel: No Berlin without a Späti) 


Auch diese regionalen Besonderheiten werden in Dialogen verfestigt. Beson- 
ders bei den Kursen in dieser Kategorie wird auch die Jugendsprache behandelt 
- hierzu existiert auch ein weiterer Kurs der Kategorie „Specials“: „Talk like a 
Babbo“. In Geschichten, bestehend aus alltagsnahen Situationen, kommen hier 
auch intrakulturelle Unterschiede zum Vorschein, beispielsweise wird die Gay- 
und Technoszene mit in die Handlung integriert, indem sie Schauplatz eines 
Dialogs ist („Berghain ist he most famous (gay) club in Berlin - and probably 
Europe. Some describe it as the world capital of techno.“) und auch die gezeigten 
Bilder zu Erklärungen stellen ein vielseitiges Deutschlandbild dar: 
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What if...? 


Abb. 4: Kopfkino (Original in Farbe) 


Die App bemüht sich hier um eine lebhafte und in Deutschland realitätsnahe 
Vermittlung der sprachlichen Inhalte, welche Raum für interkulturelle Rück- 
schlüsse geben. So wird in dieser kurzen Sequenz (Abb. 4) das Kennenlernen 
zweier Personen, wie es sich in Deutschland abspielen könnte, Alkoholkonsum 
und durch das Bild eine offene Einstellung zu Homosexualität abgebildet - 
Themen, die in anderen Kulturen auf andere Weise behandelt werden könnten. 
Bemerkenswert ist hierbei vor allem, dass besonders das Thema Homosexuali- 
tät in Lehrwerken des DaF-Unterrichts eher selten aufgegriffen wird. Lediglich 
in Begleitmaterialien für den Deutsch als Zweitsprache-Unterricht (z.B. Mein 
Leben in Deutschland oder Vielfalt leben) wird diese Thematik aufgegriffen 
und meistens im Zusammenhang mit dem Thema Lebensformen oder Dis- 
kriminierung thematisiert. Die App hingegen lässt das Thema beiläufig in die 
Handlung einfließen, die Nennung des Begriffs „(gay) club“ und das Bild zweier 
tanzender Männer wirken durch ihre Beiläufigkeit eher normal und werden 
nicht als Tabubruch thematisiert. Diese Inhalte werden von der App implizit 
vermittelt, eine Reflexion/Evaluation bleibt allerdings aus, sodass Lernende die 
vermittelten Inhalte allein verarbeiten müssen. 
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3.2 Busuu 


Zu Beginn der App hat der/die Lernende die Auswahl zwischen ,,Complete 
German“ oder „German for Travel“. Wählt man die erste Lektion von „Com- 
plete German‘, beginnt der Kurs für Lernende ohne Vorkenntnisse und wird 
mit den Flaggen Deutschlands, Österreichs und der Schweiz eingeleitet. Der 
von der App aufgezeigte DACH-Ansatz wird auch gleich in der ersten Lektion 
umgesetzt: So werden die Flaggen Deutschlands, Österreichs und der Schweiz 
gezeigt und die App gibt an: „Today we'll learn about... 1. Formal titles and 
greetings 2. Regional greetings in [Flaggen Deutschlands, Österreichs und der 
Schweiz]“ (Welcome to Busuu’s German course). 

So werden gleich zu Beginn des Kurses verschiedene intralinguale Unter- 
schiede hervorgehoben und thematisiert. Die Begrüßungen „Moin“, „Grüß 
Gott“, „Servus“ und „Gruetzi“ werden vorgestellt und die verschiedenen Re- 
gionen benannt, in denen diese Variationen verbreitet sind, dabei werden fo- 
tografische Abbildungen (Abb. 5) eingesetzt: 


Moin (moin)! Grüß Gott! 


Hello! (northern German, informal) Hello! (southern German, formal) 


Abb. 5: Begrüßungen (Original in Farbe) 


Sind die gezeigten Fotografien für diese Begrüßungsarten stereotypisch, zeigen 
andere Abbildungen zu Begrüßung und Verabschiedung ein vielseitiges Bild 
deutschsprachiger Länder mit Menschen aus verschiedenen Kollektiven. Diese 
werden auch im zur Lektion gehörigen Video betont. Innerhalb der Lektion 
wird auf den Youtube Channel von Busuu und das Video „12 German greetings 
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they WON'T teach you in school“ verwiesen. In diesem Video erklärt „Ger- 
man Language Expert“ Anna verschiedene Formen der Begrüßung und Ver- 
abschiedung in unterschiedlichen Regionen, auch unter Beachtung Österreichs 
und der Schweiz. So wird hier ebenfalls auf umgangssprachliche Ausdrücke 
wie „Na?“ oder Jugendsprache wie „Was geht ab?“ eingegangen. Frontal, aber 
auf amüsante Weise, werden diese Formen eingeführt und in Beispielen ver- 
wendet. Die Erklärungen finden hierbei auf Englisch statt. Dadurch, dass nur 
eine Person im Video präsent ist, können Interaktion zwischen Personen und 
beispielsweise Distanzen, deren Beobachtung Lernenden zu einer Sensibilisie- 
rung verhelfen können, nicht gezeigt werden, jedoch geht die Sprachexpertin 
auch auf Betonung und Mimik ein. 

Zurück in der App unterstützen Bilder (Abb. 6) das Verständnis vom Mit- 
einander im deutschsprachigen Raum: 


Hi! 


When you meet friends, you can say 


Guten Tag! - Guten Tag! 


To respond politely, we usually return the "Hallo" or "Hi" to greet them. 


same greeting. 


It is considered polite to mirror the Germans often think using English words 
person who greets you is cool. @ 


Abb. 6: Begrüßungen und Tipps (Original in Farbe) 


Hinweise und Erklärungen zu interkulturellen Handelsweisen und landes- 
kundlichen Themen finden sich innerhalb der Lektionen und sind in die je- 
weiligen Themenbereiche integriert und implizit. Hierbei nutzt die App einen 
spielerischen, informellen Umgang, um landeskundliche und interkulturelle 


6 Video abrufbar unter: https://www.youtube.com/watch?v=flfayo4HiJ0, 21.10.2020. 
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Inhalte zu adressieren (Abb. 6) und kulturspezifische Konventionen des Kom- 
munizierens zu verdeutlichen. Auch ermutigt Busuu Lernende, landestypische 
Dinge zu probieren, wie zum Beispiel die Apfelsaftschorle im folgenden Bei- 
spiel (Abb. 7). Durch Appelle wie diese „go ahead and try one of the many 
types of Schorle!“ werden Lernende dazu ermutigt, sich auf die neue Kultur 
und ihre Besonderheiten einzulassen. So werden auch in den Lektionen zum 
Bar- bzw. Restaurantbesuch weitere landeskundliche Erklärungen angeboten 
und das Verständnis dieser hier auch überprüft: 


Y xX oy x 


D Q Which of these is a typical German 
beverage? 

Here's a tip! Here's a tip! 

When we talk about sparkling water we In Germany many people like to drink Schorle. 

mostly use the noun "Sprudel", but you might Its a drink made by mixing fruit juice or white 

also hear "Kohlensäure" (carbon dioxide). For wine with sparkling water, The most popular 

non-carbonated water you can also use the type of Schorle is Apfelschorle made with apple Wassa 

adjective "still" (still, also literally meaning juice. If you ever visit Germany go ahead and 


“quiet'). try one of the many types of Schorle! 


Abb. 7: Sprudel und Schorle (Original in Farbe) 


Leistet die App zwar keine Selbstevaluation zur Einstellung der Lernenden 
oder Reflexion der vermittelten interkulturellen Inhalte, werden hier jedoch 
nicht nur die sprachlichen Inhalte, sondern auch das vermittelte landeskund- 
liche Wissen abgefragt. 

Die Dialoge behandeln thematisch und den Sprachmitteln angemessen den 
Inhalt der Lektion und finden in einem authentischen Rahmen statt: 


Bea: Dieser Wein ist sehr gut! 

Martin: Soll ich dir eine Flasche bestellen? Ich trinke lieber Bier. 

Bea: Danke! Ein Glas ist genug. Wollen wir auch Wasser bestellen? 
Martin: Ja klar, mit oder ohne Sprudel? 

Bea: Mit, danke. 

Martin: Gut, dann nehmen wir eine Flasche Sprudelwasser mit zwei Glä- 
sern, ein Glas Wein und ein großes Bier. 

(Busuu Lektion 44: Shall we sit at a bar: Dialogue) 
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Wird in der englischen Einleitung die Situation beschrieben (,,Bea and Martin 
are at a bar talking about the drinks they want to order“), ist der Dialog, den 
die Lernenden hören und lesen können, passend zum lockeren Setting und 
authentisch vorgetragen. Die erarbeiteten landeskundlichen Informationen 
zum Sprudelwasser werden auch hier thematisiert, sodass die Lernenden sich 
weiter mit diesem Thema auseinandersetzen können. Die Charaktere in den 
Dialogen wurden hierbei von der App nicht eingeführt, die verwendeten Bil- 
der entsprechen zwar dem Gender der Personen, stellen sie jedoch nicht in 
der beschriebenen Situation dar, was eine Identifikation mit den Charakteren 
erschwert. 

Im Zusatzkurs „German for travel“ werden Lektionen zu verschiedenen 
Schwerpunkten wie Transport, Restaurantsuche, Organisation eines Ausflugs 
und Sightseeing angeboten. Auch hier werden Dialoge in möglichen Situati- 
onen während eines Besuchs in deutschsprachigen Ländern präsentiert und 
oft verschiedene Optionen gegeben, was ein Einheimischer/eine Einheimische 
antworten könnte. Fragemöglichkeiten sind zum Beispiel: „Gibt es ein gutes 
Restaurant hier in der Nähe?“ und „Können Sie mir ein Restaurant hier in 
der Nähe empfehlen?“ Nach der Einführung dieser sprachlichen Mittel wer- 
den mögliche Antworten präsentiert: „Sie könnten es mit dem Café Havanna 
versuchen.“, „Es heißt Cafe Havanna“ oder „Es gibt ein tolles Restaurant in 
der Grünstraße“. Hiermit lernen Lernende verschiedene mögliche Antworten 
kennen, die zu einem authentischen minimal action game verwendet werden 
können und somit für den Gebrauch dieser Mittel sensibilisiert werden. 

Zusätzlich zu den Kursen bietet Busuu eine weitere in die App integrierte 
Funktion an: „Social“. Hier können Lernende durch Aufgaben Kontakt zu an- 
deren Lernenden aufnehmen, die die gewählte Fremdsprache ebenfalls lernen. 
Dies dient laut App zum einen als Unterstützung zum Erlernen der Sprache, 
deutschsprachige Benutzer/innen haben jedoch zum anderen die Möglich- 
keit, Aufgaben zu bewerten und zu korrigieren. Hierbei gibt es bei einigen 
Lektionen die Aufgabenstellung „Conversations“. In dieser haben Lernende 
die Auswahl, die Aufgabe schriftlich oder mündlich abzulegen und zu einer 
bestimmten Situation/Fragestellung eine Äußerung zu verfassen. Die Aufgabe, 
entweder schriftlich festgehalten oder mit dem Mikrofon aufgenommen, wird 
dann zur Korrektur an die „Community“ gesendet. Hier können Lernende, 


© Frank & Timme Verlag für wissenschaftliche Literatur 99 


Ann-Katrin Fierus 


die angegeben haben, dass sie Deutsch sprechen, die Aufgabe mit bis zu fünf 
Sternen, Kommentaren und Verbesserungen korrigieren und ein Feedback 
geben. Es gibt hier somit einen direkten Austausch mit anderen Sprecher/ 
innen der Zielsprache, teils Muttersprachler/innen, sodass ein interkultureller 
Austausch auf diese Weise stattfinden kann. Die Funktion ermöglicht somit 
eine Kontaktaufnahme, die zum weiteren interkulturellen Austausch anregen 
kann. Hierbei soll jedoch angemerkt werden, dass die Korrekturen unkontrol- 
liert an die Lernenden weitergegeben werden, hier also Fehler innerhalb des 
Feedbacks nicht ausgeschlossen werden können. 

In Bezug auf die interkulturelle Kompetenz kann diese Option jedoch als 
Ansporn für den Austausch mit der Zielkultur gesehen werden und die Aus- 
prägung dieser somit fördern. 


3.3 Duolingo 


Startetman die App Duolingo und gibt an, dass man noch keine Deutsch-Kennt- 
nisse hat, werden verschiedene Kategorien aufgezeigt. Diese heißen „Basics 1°, 
„Intro“ oder „Phrases“ und können durch Abschluss der vorherigen Lektionen 
freigeschaltet werden. Die einzelnen Lektionen sind so aufgebaut, dass zu- 
nächst Wortpaare in Deutsch und Englisch gefunden werden müssen, danach 
werden Wörter und Phrasen geübt. Bei der Lektion „Intro“, also der Vorstel- 
lung, fällt auf, dass zwar verschiedene Möglichkeiten zur Vorstellung der eige- 
nen Person gegeben werden („Ich bin Hans‘; „Hallo, ich heiße Julia“ vgl. Intro), 
hier findet aber kein Dialog und somit kein minimal action game statt. Auch 
in den Lektionen zum Thema „Essen“ (Food 1, Food 2) werden keine Dialo- 
ge aufgeführt. Zwar werden Sätze zum Themenfeld vorgestellt und durch die 
Übungen (Übersetzen, teils durch die Anordnung durch Wörter) eingeübt, je- 
doch bleiben auch hier dialogische Handlungsspiele komplett aus. Phrasen wie 
„Die Speisekarte ist schmutzig“ oder „Ich koche nicht ohne Wasser“ werden 
ohne Zusammenhang präsentiert. Jedoch bietet Duolingo eine weitere Katego- 
rie „DuolingoStories“ (Abb. 8). Mit diesen Kurzgeschichten können Lernende, 
laut App, Lese- und Hörverstehen verbessern. Die Geschichten bestehen aus 
Dialogen, die durch kurze Verständnisfragen unterbrochen werden: 
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« Ein Date & @ Mein Vater kommt aus 
Italien ... 
dò Julia hat ein Date. 
ee 
Ve BB @ .. und meine Mutter kommt 
G aus Deutschland. 
x «> Eine Frau kommt zu Daniel. 
DG | 
4 Gut danka A @ Ich komme auch aus 
a Italien! 8 @ Entschuldigung, bist du 
@ Was möchtest du essen? Daniel? Ich bin Katrin 
& @ Italien ist schén! 
A @ Einen Salat, = 
f} @» Nein, tut mir leid. Ich bin 
4) Hast du Hunde oder 
A > Ich esse kein Fleisch Katzen? Felix. 
De esis Vegetarierin? A > Ich habe eine Katze und At the end of the story, Daniel... 
einen Hund. 
A PR ... was tired of talking to Julia. 
Rn ò Ja 
les} @ Ah, toll! 
x ... met someone named Jan 
@ Ich auch! = 
@ Ich habe auch einen Hund, .. lied to his real date because he 
A > Super! radi likes Julia. 
A E> Was? Ich heiße Julia! 
A «4» Woher kommst du? s 
A dò Und mein Date heißt Felix 
D @ Aus Frankreich vy 


Abb. 8: Duolingo Stories: A Date (Original in Farbe) 


So werden hier Dialoge angeboten, die in authentischen Situationen im 
deutschsprachigen Raum zu finden sind (ein Blinddate wie im Beispiel dar- 
gestellt ist in Deutschland nicht ungewöhnlich), die Authentizität der Dialoge 
selbst ist jedoch fraglich. Hier geht es in erster Linie darum, Sprachmittel zu 
benutzen und zu wiederholen. Dies leistet die App in einer amüsanten Weise, 
interkulturelle Themenfelder werden hier jedoch nicht behandelt. 

Die in dieser Kategorie, aber auch in den Lektionen gezeigten Grafiken 
sind immer Illustrationen bzw. Animationen, keine authentischen Fotografien 
(Abb. 9). Hierbei fällt auf, dass sich die Bilder wiederholen und nicht unbe- 
dingt zu den Aussagen passen, sodass Lernende hierbei keine Rückschlüsse 
auf kulturelle Themen ziehen können: 


d Wir heißen Anna und 


& Lukas. 


Abb. 9: Illustrationen (Original in Farbe) 


Yes, | speak English. 
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Duolingo begriindet die Auswahl ,,unerwartete[r] Inhalte“ (duolingo.de) da- 
mit, dass diese Lernende veranlassen, ,,sorgfaltig tiber die Sprache nachzu- 
denken, die sie lernen“ (ebd.). Zu diesen unerwarteten Inhalten kann auch die 
Verwendung einer Bären-Illustration gewertet werden. Dies trägt in diesem 
Falle jedoch nicht zur Sensibilisierung durch Bilder bei. Auch unterstiitzende 
Videos werden in der App nicht verwendet und Zusatzmaterialien wie Pod- 
casts gibt es zwar für Spanisch oder Französisch, jedoch nicht für Deutsch 
(vgl. https://podcast.duolingo.com/). Bleibt die Vermittlung interkultureller 
Inhalte in den einzelnen Lektionen somit weitestgehend aus, kann vor jeder 
Lektion jedoch ein ,,Tipp* abgerufen werden, der Ratschlage fiir die kommende 
Lektion beinhaltet und bei manchen Lektionen auch einige landeskundliche 
Inhalte vermittelt, aber kein differenziertes Bild liefern, wie in der folgenden 
Abbildung zum Thema Essen zu sehen ist: 


Wie heißt du? Meals In Germany 


For Frühstück, most Germans have bread with 


in English, we say My name is ... In German, 


you say Ich heiße... an assortment of spreads, cheeses and sliced 

meats. 

m, Das Mittagessen is the largest meal of the day, 

I Pre and usually the only hot meal of the day. 

ep 
Das Abendessen is typically served cold and is 
smaller than lunch. Germans typically have 
breads, cold cuts, cheeses, and vegetables 
[er On some Sundays or for spec 
Ich heiße Julia, Germans enjoy a late afternoon Kaffee und 


! 
tam called Julia Kuchen 


A handshake is very important in the 


peaking world. Make sure your 


handshake is firm, brief, and not bouncy 


Abb. 10: Tipps (Original in Farbe) 


Diese Einleitungen in die Lerneinheiten sind nicht explizit als solche ausgewie- 
sen und durch die Voranstellung nicht Teil der eigentlichen Lektion, sodass kei- 
ne der von Ciepielewska-Kaczmarek et al. (2020: 77) beschriebenen Kategorien 
gänzlich zur Einbettung der landeskundlichen Einheit passt. Da die Erklärun- 
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gen jedoch die Thematik der Lektion aufgreifen, kann man hier bestenfalls von 
einer vorangestellten, additiven Erklarung sprechen. In den untersuchten Lek- 
tionen wurden somit allgemeine Informationen zum deutschsprachigen Raum 
gegeben, der DACH(L)-Ansatz wird (in den untersuchten Modulen) hierbei 
jedoch nicht verfolgt. Die hier gezeigten Illustrationen können als Karikaturen 
in alltäglichen Situationen gesehen werden, unterstützen die Lernenden aber 
dadurch nur sehr bedingt in der Sensibilisierung zu interkulturellen Themen 
wie spezifische Mimik, Gestik oder auch Distanzverhalten. 

Duolingo bietet desweiteren „Bonus Skills“ an, die für erspielte „Lingots“ 
freigeschaltet werden können. Hierbei können Lernende zwischen „Idioms 
and Proverbs: Learn some German idioms and proverbs“ und „Flirting: Do 
you believe in love at first sight? Learn to flirt in German“ wählen. 

Bei der Untersuchung der Themenbereiche fällt auf, dass auch hier keine 
Dialoge, sondern nur einzelne, kontextlose Phrasen, wie „Der nächste Kaffee 
geht auf mich“, eingeübt werden. Einige dieser Redemittel werden im Alltag 
zwar verwendet, jedoch bekommen Lernende keinerlei Informationen darü- 
ber, wie sie zu benutzen bzw. wann diese angebracht sind. Aussagen wie „Du 
siehst aus wie meine nächste Freundin“ können schnell anzüglich oder unpas- 
send wirken. Dadurch, dass Lernende nicht zur Reflexion angeregt oder durch 
Erklärungen für die Anwendung der Redemittel sensibilisert werden, bleibt 
nicht nur der Zuwachs an interkultureller Kompetenz aus, auch der Erfolg bei 
Einsatz der Sätze in realen Situation bleibt fraglich. 


4 Zusammenfassung der Ergebnisse 


Die vorangegangene Untersuchung der drei Sprachlern-Apps hat Aufschluss 
über verschiedene Themenbereiche gegeben, die in diesem Abschnitt vor- 
gestellt werden. So konnte gezeigt werden, dass Apps sich stark in Aufbau 
und Form voneinander unterscheiden, was einen direkten Vergleich dieser 
schwierig gestaltet. Besonders durch verschiedene Kursarten (z.B. Deutsch 
für den Urlaub, Zusatzkurse) und verschiedene Zusatzangebote wie Youtube 
Channels, Webansichten, Chats und Podcasts, gestaltet sich ein direkter Ver- 
gleich kompliziert. 
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Auch in Bezug auf die Vermittlung der interkulturellen Kompetenz gab es 
somit erhebliche Unterschiede in den untersuchten Teilen der drei ausgewähl- 
ten Apps, welche in der folgenden Tabelle zusammengefasst werden: 


Babbel Busuu Duolingo 
Landeskundliche Inhalte M M / 
(Fachwissensvermittlung) Durch Einschübe in Werden teilweise Teilweise als 
Lektionen integriert zusätzlich in vorangestellte 
und implizit den Lektionen Erklärungen 
abgefragt 
Language Variety und Mm mi 
intra-kulturelle Unter- 
schiede so wie DACH- 
Ansatz 
Minimal Action Games M M 
(authentische Dialoge) 
Videos und Bilder M M 
(non-verbale und para- Fotos in der App; Fotos in der App; 
verbale Elemente) Videos als Zusatz- Auf YouTube 
lektionen Videos wird ver- 


wiesen 


Während sich Duolingo stark auf die Vermittlung von Vokabular beschränkt 
und nur wenige landeskundliche Inhalte einen Teil der Fachwissensvermitt- 
lung darstellen, gehen die Anwendungen Busuu und Babbel durch verschie- 
dene Mittel über diesen ersten Schritt der Wissensvermittlung hinaus und 
können Lernende bei der Sensibilisierung für interkulturelle Schwerpunkte 
unterstützen. 

Durch landeskundliche Erklärungen und Themenfelder, die bei Babbel und 
Busuu in die Lektion integriert und bei Duolingo vorangestellt sind, geben die 
Anwendungen Informationen zu kulturellen Phänomenen und Besonderhei- 
ten. Besonders ins Detail gehen diese Erklärungen bei Babbel, da hier u.a. 
alltagsnahes Fachwissen (Bargeldzahlungen, Trinkgeld) behandelt werden. 
Busuu fragt die vermittelten Informationen direkt ab und sichert hier das 
Verständnis dieser Themenbereiche (vgl. das Thema Saftschorle). 

Im Punkt Language Variety zeigt Duolingo in den untersuchten Lektionen im 
Gegensatz zu den anderen beiden Apps keine DACH-Ansätze. Diese werden 
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von Babbel in gesonderten Zusatzkursen hervorgehoben - wobei der Fokus 
dennoch eher auf deutschen Varietäten liegt - während Busuu sie in die Lekti- 
onen mit einbindet und auch im zusätzlichen Video thematisiert. Beide Apps 
leisten hier positive Ansätze zur Sensibilisierung der Lernenden. 

Im Bezug zu den präsentierten Dialogen fällt bei Duolingo auf, dass die 
App als einzige keine Dialoge innerhalb der einzelnen Lektionen bearbeitet. 
Werden Dialoge in Kurzgeschichten verwendet, sind diese weniger authentisch 
als die in die Lektionen integrierten Dialoge bei Babbel und Busuu. Besonders 
Babbel fällt hier positiv auf, da es Dialoge in einen authentischen Rahmen setzt 
und mit den lektionsbegleitenden Charakteren Identifikationsmöglichkeiten 
schafft. Lernende bekommen hier ein alltagsnahes Deutschlandbild aufgezeigt, 
da in den Dialogen authentische Sprache benutzt und kulturspezifische Infor- 
mationen aufgegriffen werden, sodass Babbel zum Ausbau der interkulturellen 
Kompetenz beiträgt. 

Durch Bilder (bei Busuu und Babbel) zeigen die Anwendungen alltägliche 
Situationen und präsentieren ein vielseitiges Deutschlandbild - wobei hier 
bei einigen Bildern auf die Vermeidung von Stereotypen zu achten ist (Bu- 
suu). Besonders Babbel ist durch seine realitätsnahen Fotos hervorzuheben. 
Tabuthemen wie Homosexualität werden durch die Verwendung von Fotos 
vermittelt, jedoch nicht als solche thematisiert, sodass Lernende diese nicht als 
Tabubruch wahrnehmen. Duolingo ist die einzige App ohne Fotos und benutzt 
Bilder, die zufällig gewählt scheinen und den Lernenden keine Aufschlüsse zur 
Kultur in deutschsprachigen Ländern geben. 

So präsentieren Busuu und vor allem Babbel situationsnahe Dialoge und 
gehen mit zusätzlichen Video-Lektionen, in denen spezifische Themen oder 
aber auch Schwierigkeiten (critical incidents) angesprochen werden, noch 
über dies hinaus (Babbel). Hierbei gibt es keine konkreten Fragestellungen 
oder Aufgaben zum Vollzug eines Perspektivwechsels oder „zum Vergleichen 
und Kontrastieren von Alltagssituationen“ wie Usener (2016: 53) bei Lehr- 
werken untersucht. Die Selbstevaluation wird von den Lernenden in keiner 
der Apps eingefordert, sodass interkulturelle Themen zwar behandelt wer- 
den, Lernende mit der Be- und Verarbeitung dieser jedoch allein gelassen 
sind. Diese unterstützte Reflexion, welche in Apps nicht gegeben ist, kann 
im DaF/DaZ-Unterricht durch die Lehrkraft oder Mitlernende angeregt und 
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eingeleitet werden. Der Austausch tiber Andersartigkeiten, die Besprechung 
verschiedener Phänomene sowie die Möglichkeit, Fragen über die Zielkultur 
(und auch die eigene) zu stellen, können in Gesprächen miteinander, nicht 
aber alleine über eine digitale Lernanwendung geklärt werden, da der Aus- 
tausch, beispielsweise über Busuu’s „social“ sehr beschränkt bleibt. Auch die 
allgemeine Behandlung des Konzepts „Kultur und Kommunikation‘, die für 
eine Ausprägung der interkulturellen Kompetenz notwendig ist, leisten die 
untersuchten Anwendungen nicht, sodass ein wichtiger Punkt, die Erkenntnis 
des eigenen Ethnozentrismus, nicht thematisiert wird. 


5 Fazit 


Hat die Untersuchung der verschiedenen Apps teilweise Ansätze zur Ver- 
mittlung interkultureller Kompetenz gezeigt, konnte jedoch auch festgestellt 
werden, dass eine Reflexion des Präsentierten ausbleibt. Sprachlern-Apps, die 
interkulturelle Kompetenz aufgreifen, können somit nicht als uneingeschränk- 
ter Ersatz des DaF/DaZ-Unterrichts gelten. Jedoch können sie diesen sehr wohl 
unterstützen. Hierfür plädiert auch Godwin-Jones (2017: 13): 


Important in that process is presenting persuasive illustrations of le- 
arning connected to students’ lives (present and future) and to bring 
those experiences into the classroom. The most effective way to do that 
may be through the smartphone they likely all own. The opportunity is 
to leverage those digital devices and online experiences to enable and 
encourage in our student's life-long learning, learner autonomy, and 
critical digital literacy. 


Bekommen DaF/DaZ-Lernende durch die Nutzung von Apps neue Anregun- 
gen zu interkulturellen Themen, welche danach mit Mitlernenden und Lehr- 
kräften thematisiert und reflektiert bearbeitet werden können, sind bestimm- 
te Sprachlern-Apps wie Babbel und Busuu nicht nur in anderen Feldern des 
Spracherwerbs ein unterstützender Faktor beim Fremdspracherwerb, sondern 
auch im Erlangen und Ausbau der interkulturellen Kompetenz. Besonders in 
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Zeiten, in denen kein Präsenzunterricht geleistet werden kann, können diese 
Apps kurzfristige Alternativen bieten. 

Durch die fortwahrende Weiterentwicklung von digitalen Anwendungen 
bleibt jedoch ein großes Forschungsgebiet erhalten, welches Raum für weitere 
Analysen lasst. So konnen weitere Untersuchungen klaren, ob sich die ver- 
schiedenen Apps in der Vermittlung der interkulturellen Kompetenz weiter- 
entwickeln bzw. weiterentwickelt haben, so wie es bei gedruckten Lehrwerken 
bereits der Fall war. Ein weiteres interessantes Forschungsthema ist außerdem 
die Frage, ob Nutzer/innen der Apps Busuu und Babbel die aufgezeigten Mittel 
als interkulturelle Sensibilisierung wahrnehmen. Da ein Zuwachs an digita- 
len Lernanwendungen auch in der Zukunft als wahrscheinlich gilt, gibt es 
im Feld der Vermittlung interkultureller Kompetenz also nicht nur weitere 
Forschungsthemen für Wissenschaftler/innen - viel mehr besteht hier auch 
für die Verantwortlichen dieser Apps noch viel Potential zum Ausbau dieser 
unabdingbaren Komponente zum Fremdspracherwerb. 
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Geeignet zum DaF/DaZ-Lehren? 
Evaluation der Rolle sozialer und personaler Kompetenzen 
in Eignungstests fiir DaF/DaZ-Studierende 


Einleitung 


Als ich mich letztes Jahr bei einem DAX-Unternehmen! als Trainerin bewarb, 
absolvierte ich dafür ein dreistufiges Assessment Center? bestehend aus einem 
einstündigen psychologischen Eignungsgespräch (inklusive Rollenspielen), ei- 
ner fremdbeobachteten Arbeitssimulation, die die Vorbereitung und Durch- 
führung einer Unterrichtseinheit umfasste, und einem Gruppengespräch. Laut 
Ausschreibung ging es bei diesem Auswahlverfahren vor allem darum, meine 
sozio-kommunikativen Kompetenzen und Fähigkeiten als Motivator*in zu 
evaluieren/testen, denn diese wurden als Schlüsselkompetenzen für die Trai- 
nings- Aufgabe eingestuft. 

In Organisationen der freien Wirtschaft sind eignungsdiagnostische Ver- 
fahren dieser Art übliche Praxis. Der Personalauswahl und -entwicklung wird 
große Bedeutung für den langfristigen Erfolg des Unternehmens beigemessen 
und entsprechend werden viele Ressourcen und Aufwand in die Prüfung der 
berufsrelevanten Persönlichkeitsmerkmale und Kompetenzen investiert (vgl. 
Hechinger & Seibert 2015: 42). Sozialen und personalen Kompetenzen wie 


1 Aus Gründen der vertraglich vereinbarten Geheimhaltung wird der Name des Unternehmens 
anonymisiert. 


2 Ein Assessment Center (AC) ist eine Methode der Personalauswahl und -entwicklung, die eine 
Sequenz von Situationen darstellt, in denen die Teilnehmer*innen alleine oder in Kleingrup- 
pen zusammen mit anderen Teilnehmer*innen und Beobachter*innen Aufgaben bearbeiten, 
die Aufschluss über arbeitsbezogene Fähigkeiten, insbesondere soziale Kompetenzen, geben 
sollen (Fisseni & Fennekels 1995; Hossiep 1994 in Asendorp & Neyer 2012: 164). Hierzu 
zählen auch durch Expert*innen beobachtete tätigkeitsnahe Simulationen und Rollenspiele, 
aber auch Tests, persönliche Interviews oder Gruppengespräche (Panels). 
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Konfliktfahigkeit, Durchsetzungsvermögen, kommunikative Kompetenz und 
Empathie werden dabei eine immer größere Wichtigkeit zugeschrieben und 
mithilfe berufspsychologischer Methoden wie 0.g. ACs, insbesondere bei Füh- 
rungsaufgaben, intensiv getestet (vgl. Schmidt 2016). Denn diese Fähigkeiten 
werden als „Humankapital“ betrachtet (vgl. Brohm 2009: 62). 

In personenzentrierten Berufen (wie dem Lehrberuf) gelten soziale Kom- 
petenzen sogar als Schlüsselkompetenzen (vgl. Kanning 2005: 14; Boeger 2016: 
6). Erstaunlicherweise finden diese jedoch selten eine explizite Beachtung in 
Kompetenzmodellen für Lehrende wie z.B. das europäische Profilraster für 
Sprachlehrende (vgl. EPR 2020). 

Eine vergleichbare Prüfung der persönlichen Eignung angehender Leh- 
renden vor der Studienaufnahme wird erst in den letzten Jahren kontrovers 
diskutiert und ansatzweise getestet (vgl. Boeger 2016; Mayr 2015; Kieschke 
2015; Nieskens 2016; Schaarschmidt et al. 2017, Klusmann et al. 2011; Renger 
et al. 2019). Als Auslöser der Debatte um Eignungsprüfungen gilt u.a. die Un- 
terschätzung der Lehrtätigkeit und ihrer Herausforderungen (vgl. KMK 2013: 
2; siehe dazu auch Kieschke 2015: 23). Auch die Erfahrungen aus Finnland, wo 
selektive Eignungsprüfungen in Form von ACs durchgeführt werden, spielen 
nicht zuletzt wegen des bildungspolitischen Erfolgs Finnlands eine Referenz- 
rolle (vgl. Kricke 2016: 305; Mayr 2015: 62). In Deutschland hat der Einsatz 
eignungsdiagnostischer Verfahren wie des Parcours’ oder des CCT* bisher 


3 Parcours: Eintägiges AC der Universität Passau mit Simulation lehramtsspezifischer Situa- 
tionen zur Fremdeinschätzung der Lehreignung. Das Verfahren umfasst Selbstpräsentation, 
Gruppendiskussion, Empathieübungen und Rollenspiele. Das Verfahren ist primär als Bera- 
tungsangebot und nicht zur Fremdselektion konzipiert (Seibert & Hechinger 2009 in Renger 
2019: 39). 


4 Career Counselling for Teachers (CCT) ist ein onlinebasiertes Selbsterkundungsangebot zur 
Selbsteinschätzung der persönlichen Eignung und Motivation für den Lehrberuf und das 
grundsätzlich als Beratungsprogramm von Lehrbildungsausrichtungen aus sechs europäi- 
schen Ländern konzipiert wurde. Die Online-Fragebögen dienen der Auseinandersetzung 
mit persönlichen Einstellungen, Fähigkeiten und Erfahrungen und ihre Bedeutung für die 
Profession mit Ergebnisriickmeldungen. Ferner umfasst CCT auch geführte Touren für die 
Interpretation der Ergebnisse, Informationen über das Bildungswesen und den Lehrberuf 
sowie Karrieremöglichkeiten und Reportagen von Lehramtstudierenden und Lehrenden 
mit Berichten aus ihrem Leben (vgl. Mayr 2015: 60; https://www.cct-germany.de/CCT/ 
SetAudience). 
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keine Konsequenz fiir die Zulassung zum Studium (vgl. Boeger 2016: 2). Der 
Trend in der bildungspolitischen Diskussion verlangt jedoch zunehmend 
nach selektiven Auswahlverfahren unter Berücksichtigung berufsrelevanter 
Persönlichkeitsmerkmale und Interessen sowie psychosozialer Kompetenzen 
(vgl. Nieskens 2016: 155; Schaarschmidt et al. 2017: 43-47; Mayr 2015: 56, 58; 
Renger et al. 2019: 52). 

Während die Relevanz sozialer Kompetenzen in der Berufswelt allgemein 
anerkannt ist und für das Lehramt zumindest diskutiert wird, findet im DaF/ 
DaZ-Bereich eine vergleichbare Eignungsdiskussion bisher nicht statt. Dies 
erscheint erstaunlich, denn zu den Herausforderungen des regulären Unter- 
richts stellen Faktoren wie die enorme Heterogenität und soziale Komplexität 
in den DaF/DaZ-Klassenräumen besondere psychosoziale Anforderungen an 
die Lehrkräfte, deren Bewältigung ausgeprägte soziale und personale Kompe- 
tenzen erfordert (vgl. Tissot et al. 2019: 73£.). 

Diese erstaunliche Diskrepanz führte zu den Fragen: Wie weit ist der DaF/ 
DaZ-Bereich in Bezug auf Eignungsdiagnostik im Vergleich zum Lehramt und 
zur freien Wirtschaft? Findet eine Prüfung der sozialen und personalen Kom- 
petenzen von Bewerber*innen in den Auswahlverfahren der DaF/DaZ-Bil- 
dungseinrichtungen bereits Eingang? Die hierzu durchgeführte Untersuchung 
wird in diesem Betrag zusammenfassend dargestellt. Dabei werden zunächst 
die sozialen und personalen Kompetenzen umrissen (Kapitel 1). Im Anschluss 
daran wird ihre Relevanz für den Lehrberuf (Kapitel 2) und für den DaF/ 
DaZ-Bereich evidenzbasiert dargestellt sowie ein Modell sozialer und persona- 
ler Kompetenzen vorgeschlagen, das sich an den konkreten Anforderungen der 
DaF/DaZ-Lehrtätigkeit orientiert (Kapitel 3). Es folgt eine kurze Beschreibung 
des empirischen Designs (Kapitel 3) und eine Zusammenfassung der Unter- 
suchungsergebnisse (Kapitel 4). 


1 Soziale und personale Kompetenzen 
und ihre Erfassung 


Was unter sozialen und personalen Kompetenzen verstanden wird, ist nicht 
einheitlich. Dies liegt u.a. an der Fülle der Fahigkeitskonzepte, die den beiden 
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multidimensionalen Konstrukten zugeordnet werden und an der Vielzahl der 
synonymisch verwendeten Bezeichnungen wie z.B. soziale und emotionale 
Intelligenz (vgl. Goleman 2006). 

Es besteht dennoch Konsens darüber, dass es nicht ein allgemeingültiges 
sozial kompetentes Verhalten gibt, sondern dass dieses stets situationsgebun- 
den ist (vgl. Greif 1997 in Rothland 2010: 583; siehe dazu auch Kanning 2005: 
5 und Brohm 2009: 89). Sozial kompetentes Verhalten ist deshalb nicht inhalt- 
lich, sondern nur kontextabhängig zu definieren und an seiner Situationsan- 
gemessenheit zu bewerten (vgl. Hinsch & Pfingsten 2002: 82 in Brohm 2009: 
63, Kanning 2005: 5). 

In der Psychologie umfassen die sog. sozio-emotionalen Kompetenzen 
ein breites Spektrum an Schlüsselfähigkeiten, die Individuen helfen, eigene 
und fremde Emotionen zu erkennen und zu regulieren, für andere zu sorgen, 
verantwortungsvolle Entscheidungen zu treffen und effizient mit alltäglichen 
Herausforderungen umzugehen (vgl. Gkonou & Mercer 2018: 158). In Hand- 
lungskompetenzansätzen bezeichnen diese Kompetenzen die 


Dispositionen, kommunikativ und kooperativ selbstorganisiert zu han- 
deln, d.h. sich mit anderen kreativ auseinander und zusammenzuset- 
zen, sich gruppen- und beziehungsorientiert zu verhalten und neue 
Pläne, Aufgaben und Ziele zu entwickeln (Erpenbeck 2017: XXV). 


Während soziale Kompetenzen eher Fähigkeitskonzepte umfassen, die in der 
sozialen Interaktion von Belang sind (z.B. Einfühlungsvermögen, Kontakt- 
bereitschaft oder Durchsetzungsfähigkeit), fokussieren personale Kompeten- 
zen eher die intrapersonale, subjektive Dimension sozialer Kompetenz wie 
Selbststeuerung, Motivation oder Reflexionsfähigkeit (vgl. Brohm 2009: 61). 
Personale Kompetenzen bezeichnen demnach die Fähigkeit und Bereitschaft 
einer Person, 


reflexiv selbstorganisiert zu handeln, d. h. sich selbst einzuschätzen, 


produktive Einstellungen, Werthaltungen, Motive und Selbstbilder zu 
entwickeln, eigene Begabungen, Motivationen, Leistungsvorsätze zu 
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entfalten und sich im Rahmen der Arbeit und außerhalb kreativ zu 
entwickeln und zu lernen (Erpenbeck 2017: XXV). 


Analog zu anderen Kompetenzen umfassen soziale und personale Kompeten- 
zen sowohl kognitive Dispositionen, Wissen und Fähigkeiten, die zum kompe- 
tenten Verhalten befähigen, als auch affektive Elemente wie Werte, Emotionen, 
Motivation, Einstellungen und Bereitschaften, die als Performanzfaktoren die- 
ser Fähigkeiten fungieren (vgl. Brohm 2009: 89). 

Wie dies bei anderen Kompetenzen auch der Fall ist, stellt dieses Ver- 
hältnis zwischen den kognitiven, den motivationalen und den volitionalen 
Konstituenten von sozialer Kompetenz und ihren jeweiligen potenziellen kon- 
textbezogenen Variationen eine Herausforderung für ihre Erfassung dar (vgl. 
Zlatkin-Troitschanskaia & Seidel 2011: 228-229). Diese Kontextabhängigkeit 
zusammen mit der Multidimensionalität der Konstrukte und die Schwierig- 
keit zu bestimmen, welche Kompetenzbereiche stabile oder welche verän- 
derbare Persönlichkeitsmerkmale umfassen, macht ihre Erfassung denkbar 
schwieriger als die Messung von kognitiven Leistungen (vgl. Erpenbeck 2017: 
XIX; vgl. Zlatkin-Troitschanskaia & Seidel 2011: 226). Soziale und personale 
Kompetenzbereiche werden deshalb auch als soft skills oder weiche Fakto- 
ren bezeichnet. Diese Bezeichnung deutet in Abgrenzung zu hard skills, die 
die fachlich-technischen, messbaren Fähigkeiten für einen bestimmten Beruf 
umfassen, auf die schwierigere Erfassbarkeit und Erlernbarkeit der damit ge- 
meinten übergreifenden Fähigkeitsbereiche hin (vgl. Erpenbeck 2017: XIX). 

Eine Selektion der Studierenden nach weichen Kriterien wird deshalb mit 
Skepsis betrachtet. Kritisiert wird häufig die eingeschränkte diagnostische und 
prognostische Validität der eignungsdiagnostischen Instrumente (vgl. Klus- 
mann etal. 2011: 718; Hechinger & Seibert 2015: 42, Asendorp & Neyer 2012: 
163). Insbesondere Auswahlverfahren, die auf Selbsteinschätzungen (sog. 
Self-Assessments) zurückgreifen und in erster Linie Persönlichkeitsmerkmale 
berücksichtigen, werden wegen der geringen Validität kritisiert (vgl. Blöme- 
cke 2009: 105 in Bosse 2012: 86). Die für den Lehrberuf relevanten sozialen 
und personalen Kompetenzen ließen sich nur im persönlichen Kontakt (sog. 
face-to-face-Assessments) oder durch Verhaltensbeobachtung (z.B. durch eine 
Fremdeinschätzung im AC) valide erfassen (vgl. Renger et al. 2019: 49). 
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Die Schwierigkeiten ihrer Erfassung mindern jedoch nicht die Relevanz 
dieser Kompetenzen fiir den Lehrberuf. Dafiir sprechen zahlreiche empirische 
Befunde, die im Folgenden erläutert werden. 


2 Die Rolle der Lehrkraft 
und ihrer sozialen und personalen Kompetenzen 


Spätestens seit der Hattie-Studie besteht empirische Evidenz über die große 
Bedeutung der Lehrperson und vom Einfluss positiver Lernende-Lehrende- 
Beziehungen in Lernprozessen (vgl. Hattie 2009: 238, 297). Seitdem die Hirn- 
forschung die Verbindung von Emotion und Kognition und damit die tragen- 
de Bedeutung von Beziehungen und affektiven Faktoren für die Verankerung 
von Wissen erklären und anhand der Aktivität in den Gehirnregionen messen 
kann, ist die wichtige Rolle der Lehrkraft in Lernprozessen auch wissenschaft- 
lich nachweisbar (vgl. Hüther 2004: 31ff.). 

Die sozialen Kompetenzen übernehmen bei der Lehrtätigkeit allein deshalb 
eine bedeutende Rolle, weil der Unterricht an sich für eine ständige soziale 
Interaktion steht. Als besonders erfolgreich gelten dabei solche Lehrende, die 
einerseits eine instruierende „Regisseurrolle“ im Unterricht übernehmen und 
als „Aktivatoren“ agieren (vgl. Hattie 2009: 243), und andererseits in der Lage 
sind, eine Perspektivenübernahme zu vollziehen (vgl. ebd. 2009: 238). Empa- 
thie und Führungsfähigkeiten erscheinen im Unterrichtskontext als scheinbar 
gegensätzliche, aber einleuchtend notwendige soziale Kompetenzen für die 
Bewältigung der Anforderungen. Nach der Metaanalyse von Wang, Härtel & 
Walberg wird die als „Gruppenmanagement“ bezeichnete Fähigkeit, Lehr- und 
Lernprozesse in einem Kollektiv erfolgreich zu organisieren, Beziehungen zu 
vielen Menschen gleichzeitig zu gestalten und ihnen das Gefühl zu geben, 
der Unterricht sei für sie persönlich gestaltet, als der effektstärkste Faktor von 
gutem Unterricht identifiziert (vgl. 1993 in Dollase 2013: 89). 

Im Fremdsprachenbereich gelten soziale Kompetenzen als besonders gün- 
stige Faktoren für den Lernprozess wegen der Bedeutung moderner kommu- 
nikativer Lern- und Lehrmethoden im Spracherwerb und wegen der inter- 
kulturellen, sozialen und interpersonellen Natur von Kommunikation (vgl. 
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Gkonou & Mercer 2017: 8). Diese Fahigkeitsbereiche begiinstigen nachweislich 
die Gruppendynamik, die Klassenführung und die Qualität der Lehrende-Ler- 
nende-Beziehung (vgl. Patti 2006 und Reissmann 2006 in Gkonou & Mercer 
2018: 160). 

Empirische Studien hierzu zeigen, dass Lehrende mit hohen Werten an 
emotionaler und sozialer Intelligenz fahiger sind, ein gutes Klassenklima zu 
schaffen, in dem es Lernenden besser gelingt, die Motivation zu behalten (vgl. 
Elias & Arnold 2006; Graziano et al.2007; Nizielski et al. 2012 in Gknou & 
Mercer 2017: 7), und in dem die Häufigkeit von Konflikten und Aggressivität 
reduziert wird (Gross & Levenson 1993, 1997; Richards & Gross 1999 in Gko- 
nou & Mercer 2017: 7). Die Fähigkeit, Beziehungen erfolgreich zu gestalten, 
wirkt sich außerdem positiv auf das Wohlbefinden und die Gesundheit der 
Lehrenden aus. Es wurde festgestellt, dass das Scheitern vieler Lehrender auf- 
grund von Erschöpfungstendenzen, wie z.B. Burnout, seine Ursache eher in 
mangelnden Beziehungsgestaltungsfähigkeiten als in den kognitiven Anforde- 
rungen des Berufs findet (vgl. Kieschke 2015: 28). Personalen Kompetenzen, 
welche die eigene Wahrnehmung und Emotionsregulation begünstigen, wer- 
den eine entscheidende Rolle für die psychische Gesundheit und Zufriedenheit 
der Lehrenden zugeschrieben (vgl. Kieschke 2015: 29, 32; Schaarschmidt et 
al. 2017: 37f.; Abujatum 2007: 122 in Rothland 2010: 584). Denn diese helfen 
im Umgang mit der Erlebnisdichte, dem Entscheidungsdruck und möglichen 
im Unterrichtsalltag sich ergebenden Frustrationen (vgl. Schaarschmidt et al. 
2017: 37-38). Solche Frustrationen können sich z.B. in der Auseinanderset- 
zung mit dem Schicksal von Lernenden ergeben, von denen die Lehrbeurtei- 
lung häufig abhängt, oder im Umgang mit langwierigen Lernprozessen wie der 
Alphabetisierung (vgl. Tissot et al. 2019: 75). 

Die Studien, die sich mit dem Einfluss der sozialen Kompetenzen auf den 
Zweitspracherwerb befassen, kommen außerdem zu dem Ergebnis, dass Leh- 
rende mit hohen Werten an sozio-emotionaler Intelligenz über eine höhere 
Selbstwirksamkeit® verfügen (vgl. Moafian & Ghanizadeh 2009 in Gknou & 


5 Selbstwirksamkeit drückt das Vertrauen und die Überzeugung von Lehrpersonen aus, die 
Lernentwicklung ihrer Lernenden persönlich beeinflussen zu können. Lehrkräfte mit hoher 
Selbstwirksamkeitsüberzeugung setzen sich höhere Ziele, bürden sich mehr Arbeit auf, inves- 
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Mercer 2018: 160). Dieser wiederum wird ein hoher Einfluss auf den Enthusias- 
mus und das Engagement von Lehrenden, ihre Bindung an den Lehrberuf und 
sogar auf die Leistungen der Lernenden zugesprochen (vgl. Tschannen-Moran, 
Woolfolk Hoy & Hoy 1998; Ashton & Webb 1986; Ditton & Arnoldt 2004 in 
Lipowsky 2006: 55). Welche sozialen und personalen Kompetenzen speziell im 
Deutsch als Fremdsprache/Deutsch als Zweitsprache-Bereich von Bedeutung 
sind, wird im folgenden Kapitel erläutert. 


3 Welche sozialen und personalen Kompetenzen 
brauchen DaF/DaZ-Lehrende? Ein Modell 


Zu den Herausforderungen des allgemeinen Unterrichts kommen im DaF/ 
DaZ-Klassenraum diverse Faktoren hinzu, welche die soziale Komplexität er- 
höhen und von denen hier insbesondere der Faktor der Heterogenität hervor- 
gehoben wird. Diese Heterogenität äußert sich nicht nur in Hinblick auf die 
Herkunft, wie dies in Regelschulen und DaF-Kursen der Hochschulen häufig 
zu erleben ist, sondern auch auf andere Faktoren wie Bildungsstand und Alter 
(vgl. Tissot et al. 2019: 73) sowie Gesundheitszustand aufgrund möglicher 
psychischer Belastungen wie Traumatisierung infolge von Fluchtmigration 
(vgl. ebd.: 50). Weitere Herausforderungen z.B. in Integrationskursen bilden 
häufige Konflikte unter den Teilnehmenden sowie zwischen Lehrkräften und 
Teilnehmenden aufgrund sozio-kultureller, politischer und ideologischer Ver- 
schiedenheiten, die es von der Lehrkraft mit Sensibilität zu schlichten gilt (vgl. 
ebd.: 75). Von Lehrkräften wird dann erwartet, in konfliktträchtigen Unter- 
richtssituationen einer Eskalation entgegenzuwirken und den Teilnehmenden 
ggf. Grenzen aufzuzeigen (vgl. ebd.: 66). Die Fähigkeit, sich in solchen Situati- 
onen durchzusetzen und dabei keine neuen Konflikte auszulösen, sondern im 
Gegenteil positive Beziehungen aufrecht zu erhalten, ist hier gefragt. Empathie 


tieren mehr Zeit für Planung und Nacharbeitung des Unterrichts, probieren gerne Neues aus, 
glauben an das Voranbringen schwächerer Lernenden, nutzen das Feedback aus der Klasse 
für Verbesserungen des Unterrichts und zeigen eine höhere Identifikation mit dem Beruf 
(vgl. Lipowsky 2006: 55). 
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und Mitgefühl mit den Teilnehmenden oder die Fähigkeit, diese zum Lernen 
zu motivieren, aber auch andere affektive Faktoren, wie ein ausgeprägtes Inte- 
resse an der Tätigkeit und eine intrinsische Motivation, wurden bei der letzten 
Evaluation der Integrationskurse als zentrale soft skills von DaZ-Lehrkräften 
identifiziert (vgl. ebd.: 74). 

In diesem Zusammenhang erscheint die besondere Rolle einer empathi- 
schen Fürsorglichkeit, die offenbar die Basis von prosozialem Verhalten und 
altruistischem Engagement bildet (vgl. Howe 2013, Krznaric 2014 in Mercer 
2016: 96) ein wichtiges Werkzeug, um diesen Aufgaben gerecht zu werden. 
In der positiven Psychologie wird diese Form der Empathie wegen ihres Bei- 
trags zur menschlichen Verständigung als Instrument mit großem Potenzial 
für radikale Veränderungen des Umfelds und sogar der Gesellschaft angese- 
hen (vgl. ebd.). Auch Werte wie Respekt, Toleranz und Offenheit gegenüber 
anderen Kulturen, die für die transkulturelle Kommunikation entscheidend 
sind, werden durch diese Form der Empathie gefördert, wodurch auch die 
Kommunikation allgemein verbessert wird, die letzten Endes beim Erlernen 
von Fremdsprachen beabsichtigt wird (vgl. Gkonou & Mercer 2017: 8). 

Wie andere Lehrkräfte auch, bilden DaF/DaZ-Lehrende eine soziale 
Schnittstelle zu unterschiedlichen Bezugsgruppen, die von Lernenden und 
Kollegen bis zu Vorgesetzten und Institutionen reichen. Ein Gelingen erfor- 
dert ein hohes Maß an kommunikativer Sensibilität und Rücksichtnahme ei- 
nerseits, und andererseits die Fähigkeit, eigene Positionen, wenn erforderlich, 
offensiv durchsetzen zu können (vgl. Schaarschmidt et al. 2017: 34f.). Außer- 
dem bedarfes an dazugehörigen impulsgebenden motivationalen Werten und 
Einstellungen, die die vorhandenen sozialen Fähigkeiten zum Vollzug führen 
(vgl. Brohm 2009: 89), z.B. eine soziale Orientierung, Interesse an Menschen 
und Kommunikation sowie eine ausgeprägte Offenheit und Prosozialität. Pro- 
sozialität bezeichnet hier das Interesse und die Bereitschaft, sich mit den Anlie- 
gen fremder Menschen zu befassen und den Wunsch, ihre Probleme mit dem 
Fokus auf integrative und kooperative Lösungen zu verstehen (vgl. Kanning 
et al. 2012: 146). 

Aber nicht nur im DaZ-Klassenraum, sondern auch in der Auslandsger- 
manistik, für die Tätigkeit in bildungspolitischen Organisationen wie dem 
Goethe Institut oder den DAAD-Lektoraten bilden soziale und personale 
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Kompetenzen wie Belastbarkeit, Zuverlassigkeit, Verhandlungsgeschick, Or- 
ganisationsvermögen und Teamfähigkeit zentrale Schlüsselkompetenzen, die 
in Verhandlungen und bei der Vermittlung zwischen Institutionen aus dem 
In- und Ausland nötig sind (vgl. DAAD 2020a). Ferner werden DaF-Lehrende 
mit ihrem Interaktionsverhalten und ihren sozialen Haltungen als „Repräsen- 
tanten“ deutscher Sprache und Kultur im In- und Ausland wahrgenommen. 
Was Lehrende über ihre sozialen Interaktionen und Haltungen vermitteln, z.B. 
Offenheit und Wärme, hat somit einen direkten Einfluss auf die positive (oder 
negative) Wahrnehmung des Faches (vgl. Schart 2014: 36, Hattie 2009: 108) 
und vielleicht, biographisch-perspektivisch gesehen, auch auf ein langfristiges 
Interesse an deutscher Sprache und Kultur. Da sich die sozialen Kompetenzen 
von Lehrkräften als wichtige Prädiktoren der Zufriedenheit von Lernenden 
erwiesen haben (vgl. Kanning & Gärtner 2008 in Rothland 2010: 583) und 
eine positive Wahrnehmung Deutschlands im Ausland im Sinne außenpoli- 
tischer Kultur- und Bildungsarbeit ist (vgl. DAAD 2020b), müssten künftige 
DaF/DaZ-Lehrende m.E. für die große Bedeutung und Wirkung ihrer sozialen 
Handlungen und Einstellungen im Unterricht sensibilisiert werden. 

Im Umgang mit der enormen Diversität der DaF/DaZ-Welt ist zudem 
entscheidend, wie offen und flexibel Lehrkräfte die eigenen subjektiven Über- 
zeugungen und „Normalitätsvorstellungen“ reflektieren und ob sie bereit sind, 
die Auseinandersetzung damit konstruktiv zu gestalten und in die eigene Ent- 
wicklung zu integrieren (vgl. Terhart 2015: 26). Offenheit und Reflexion tra- 
gen so maßgebend zur Professionalisierung bei (vgl. ebd.). Dabei bezeichnet 
Reflexionskompetenz die grundsätzlich offene Haltung und Bereitschaft, sich 
mit schwierigen Inhalten auseinanderzusetzen, diese aus verschiedenen Per- 
spektiven zu betrachten und Annahmen und Grundsätze stets zu hinterfragen 
(vgl. Loughran 1996, Fishman 1998: 16, Calderhead 2006: 36, Hatton & Smith 
1995: 3 in Roters 2012: 113f.). In der Fremdsprachendidaktik besteht Konsens 
darüber, dass es Lehrenden besser gelingt, guten Unterricht zu gestalten, wenn 
sie eine forschende, kritische Haltung gegenüber dem eigenen Tun einnehmen 
(vgl. Schart 2014: 48). Auch Hattie stellt fest, dass besonders erfolgreiche Leh- 
rende vor allem diejenigen sind, „die gegenüber neuen Erfahrungen offenblei- 
ben, aus Fehlern lernen und die das Feedback ihrer Lernenden als Lernmotor 
für sich selbst betrachten“ (vgl. 2009: 35). 
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Beim Vergleich von Kompetenzmodellen und Katalogen relevanter so- 
zialer und personaler Kompetenzen für die Lehrtätigkeit (vgl. Frey & Jung 
2011:561, Kanning 2012: 143, Grein 2017: 229ff.) und unter Berücksichtigung 
wissenschaftlicher Erkenntnisse über den günstigen Einfluss bestimmter per- 
sönlichkeitsrelevanter Merkmale (vgl. Mayr 2015: 56) lassen sich immer wie- 
derkehrende Fähigkeitskonzepte erkennen, die als Kern von sozialer Kompe- 
tenz bei Lehrenden identifiziert wurden und für deren Relevanz hinreichende 
empirische Befunde vorliegen. Da es die „eine“ soziale Kompetenz nicht gibt, 
sondern sie nur kontextabhängig zu definieren ist, wurden hier die wichtigsten 
Dimensionen sozialer und personaler Kompetenz für die spezifischen Anfor- 
derungen des DaF/DaZ-Bereiches in einem Modell zusammengetragen und 
in Anlehnung an Kannings Taxonomie nach der Qualität dieser Fähigkeiten 
eingeordnet (vgl. 2005: 30): 


1. Alle perzeptiv-kognitiven Fähigkeiten, die die soziale Wahrneh- 
mung schärfen und die richtige Analyse von emotionalen und 
sozialen Situationen ermöglichen. Diese sind hilfreich für die er- 
folgreiche Etablierung von Beziehungen und positive Beziehungen 
haben nachweislich eine förderliche Wirkung auf Lernprozesse (vgl. 
Hattie 2009: 297): 

Sensibilität, soziales Bewusstsein, Wahrnehmungskomplexität und 
allen voran Empathie 

2. Alle affektiv-motivationalen Komponenten wie Interessen, Werte, 
Einstellungen und Motive, die mit einer ausgeprägt offenen und 
sozialen Orientierung zusammenhängen, da diese als Performanz- 
faktoren sozialer Kompetenz fungieren (vgl. Brohm 2009: 89) und 
die Gestaltung von Beziehungen und die Bindung zu Individuen 
motiviert und fördert: 

Kooperationsbereitschaft, Interesse an Menschen und Kommunikati- 
on, soziale Orientierung, Flexibilität, Fürsorglichkeit, Kontaktbereit- 
schaft, und allen voran Offenheit und Prosozialität 


3. Alle behavioralen Faktoren oder skills, die die Umsetzung eines 
guten Gruppenmanagements sowie die Organisation ermöglichen 
und bei Konflikten helfen: 
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Führungskompetenz, Organisationsfähigkeit, Konfliktfähigkeit, Selbst- 
regulation (z.B. Geduld) und allen voran verbale und nonverbale 
kommunikative Fähigkeiten und Durchsetzungsfähigkeit 


4. Alle perzeptiv-kognitiven Fähigkeiten und Kompetenzen, die ei- 
nen kritischen und reflexiven Umgang mit den eigenen Handlun- 
gen und Einstellungen ermöglichen, da diese als Antriebsquelle 
der Lehrprofessionalität fungieren (vgl. Terhart 2015: 26) und als 
Schlüssel zum weiteren Ausbau notwendiger Kompetenzen gelten 
(vgl. Boeger 2016: 7): 

Kritikfähigkeit, Ambiguitätstoleranz und allen voran Reflexionskom- 
petenz 


Werden all die oben genannten Kompetenzen und Einstellungen auf ein ver- 


einfachendes „Grundgerüst“ reduziert, ergibt sich folgendes Modell für den 
DaF/DaZ-Bereich: 


eaffektive 
Komponenten 


«Wahrnehmung 


Prosozialität 


pas Offenheit 


e Umsetzung 
Skills 


Abb. 1: Modell sozialer und personaler Kompetenzen für eine Lehrtätigkeit in DaF/DaZ-Bereich 
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Basierend auf der im Modell dargestellten sozialen und personalen Kompe- 
tenzen und im Kontext des zunehmenden bildungspolitischen Interesses an 
einer Eignungspriifung kiinftiger Lehrender nach sozio-kommunikativen, 
personalen und motivationalen Kriterien (vgl. Nieskens 2016: 155), galt das 
Forschungsinteresse fiir vorliegende Untersuchung der Frage, inwiefern diese 
Voraussetzungen in den Auswahlverfahren der DaF/DaZ-Masterstudiengänge 
Berücksichtigung finden. Ferner sollte die Studie zeigen, wie DaF/DaZ-Bil- 
dungseinrichtungen gegenüber einem grundsätzlichen Einsatz von eignungs- 
diagnostischen Verfahren für die Prüfung von berufsrelevanten sozialen und 
personalen Kompetenzen vor der Studienaufnahme eingestellt sind. Im Fol- 
genden wird der Aufbau der Studie skizziert. 


4 Die Studie 


Zur Datenerhebung wurden teilstrukturierte leitfadengestützte Expert*in- 
nen-Interviews durchgeführt (vgl. Helfferich 2014: 561, 569). Für die Aus- 
wahl der Interviewpartner*innen wurde die FaDaF-Zusammenstellung der in 
Deutschland angebotener DaF/DaZ-Studiengänge herangezogen (vgl. FaDaF 
2018). Auswahlkriterium für die Befragung der Bildungseinrichtung war eine 
für den Zulassungsprozess zum Master DaF/DaZ vorgeschaltete Eignungsab- 
klärung in Form einer persönlichen Begegnung, wie z.B. ein Eignungsgespräch 
oder ein Auswahlgespräch (face-to-face-Assessments). Da die Anzahl der diese 
Voraussetzungen erfüllenden Institutionen gering ausfiel‘ und nur vier der fünf 
relevanten Universitäten für ein Interview gewonnen werden konnten, wurden 
zum Vergleich auch Universitäten mit einer eingeschränkten Zahl an Studien- 
plätzen kontaktiert, die Dokumente als Zulassungsvoraussetzung anforderten, 
die den Zugang zu Informationen über die Person und damit Rückschlüsse 
auf deren Einstellungen und Interessen ermöglichten, z.B. das Einreichen ei- 
nes Motivationsschreibens und/oder eines Lebenslaufs. Insgesamt ergab sich 
eine Stichprobe von 5 Fällen. Davon führten vier Institutionen (BO3-B06) Fig- 


6 Laut Internet-Recherche setzten ausschließlich fünf Institutionen ein Eignungsgespräch für 
die Zulassung voraus. Vollständigkeit dieser Angaben ohne Gewähr. 
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nungsgespräche im Rahmen ihrer Auswahlverfahren. Bei dem übrigen Fall 
konnten die Perspektiven zweier Expert*innen erhoben werden (B01-B02). 

Die für diese Untersuchung gewonnenen Expert*innen waren allesamt Ak- 
teur*innen von DaF/DaZ-Bildungseinrichtungen (fachliche Koordinator*in- 
nen und Dozent*innen bzw. Professor*innen), die über fachliche Verantwortung 
für die Organisation der Studiengänge verfügten, an den Auswahlgesprächen 
beteiligt waren und/oder über die Kompetenz verfügten, über die Eignung der 
Bewerber*innen zu entscheiden. 

Die erhobenen Daten wurden nach der inhaltlich strukturierenden Inhalts- 
analyse ausgewertet (vgl. Kuckartz 2018: 97ff.). 


5 Ergebnisse 


Das Forschungsprojekt wurde von der Annahme geleitet, dass potenziell af- 
fektiv geladene Unterlagen wie einem Motivationsschreiben und persönliche 
Interviews bzw. Auswahlgespräche, die im Rahmen von Auswahlverfahren 
zum Masterstudiengang DaF/DaZ stattfinden, zwingend zur Ermittlung der 
persönlichen Eignungsmerkmale konzipiert sein müssten, die den Anforde- 
rungen an die künftige DaF/DaZ-Lehrtätigkeit entsprechen. Damit sind vor 
allem die Aspekte der sozialen Interaktion und der persönlichen Orientierung 
sowie verbale und nonverbale kommunikative Fähigkeiten gemeint, die im 
Modell dargestellt wurden (s.o.). Die Gründe für eine persönliche Begegnung 
und den damit verbundenen hohen organisatorischen Aufwand seitens der 
Einrichtungen konnten, so die Annahme, ausschließlich in der Ermittlung 
jener Fähigkeiten und Kompetenzen liegen, die nicht ohne weiteres anhand 
herkömmlicher Bewerbungsunterlagen überprüft werden können und nur 
über ein face-to-face-Assessment oder eine Verhaltensbeobachtung einschätz- 
bar und valide zu erfassen sind (vgl. Renger et al. 2019: 49). Die Ergebnisse, 
zeigten jedoch, dass andere Relevanzen für die Auswahl galten: Die geringe 
Gewichtung persönlicher Voraussetzungen zugunsten fachlicher Kriterien in 
den Auswahlverfahren und die hierfür angeführten Gründe werden jeweils in 
den Kapiteln 5.1 und 5.2 abgebildet. Ebenfalls wird die Rolle der Motivation 
für das Studium und praktische Erfahrungen thematisiert (Kapitel 5.3). In 
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Kapitel 5.4 wird naher auf die ambivalente Haltung der Institutionen gegentiber 
eignungsdiagnostischen Verfahren eingegangen, bevor auf die mutmaßlichen 
Konsequenzen für die Bewerber*innenzahlen skizziert werden (Kapitel 5.5). 


5.1 Persönliche Voraussetzungen: 
soziale und personale Kompetenzen 


In Rahmen dieser Studie wurde festgestellt, dass die Entscheidung für oder ge- 
gen eine Zulassung den Angaben zufolge äußerst selten von persönlichen bzw. 
weichen Faktoren abhängt. Einige Befragte wiesen sogar ausdrücklich darauf 
hin, weiche Kriterien generell nicht vorauszusetzen (B01: 159-165; B02: 508): 


Vielleicht muss ich Sie nur gleich vorwarnen [...] es geht tatsächlich in 
diesem Interview, das wir führen, weniger darum zu gucken, ob die Leu- 
te... wie lehrgeeignet sie sind. (B04: 20-23) 


Als Rechtfertigung für die Außerachtlassung von Lehreignungskriterien im 
Auswahlverfahren gilt die Begründung, dass man andere Ziele als die Lehr- 
tätigkeit haben könne: 


Man könnte eben auch ein anderes Ziel haben, als Lehrer zu werden. Man 
könnte auch an der Uni bleiben nach dem DaF-Master. |[...] Deshalb 
suchen wir danach nicht aus. (B02: 263-265) 


Erstaunlich erscheint dieses Ergebnis, wenn man bedenkt, dass soziale Kom- 
petenzen wie Empathie, Offenheit, Durchsetzungsfähigkeit und eine berufs- 
verbundene soziale Orientierung auf Nachfrage von der Mehrzahl der Inter- 
viewten als berufsrelevante Eignungsdimensionen betrachtet werden, um den 
spezifischen Anforderungen der DaF- oder DaZ-Lehrtätigkeit, etwa durch die 
soziale Heterogenität der Lernenden, gerecht zu werden. Die Förderlichkeit 
personaler Kompetenzen wie Geduld (B04: 271), Belastungsfähigkeit (B03: 
288-292), Selbstregulation und Resilienz (B04: 339-343) insbesondere bei 
DaZ-Kursen wurde dabei hervorgehoben: 
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Ja, auch eine gewisse Resilienz. Dass man sich als Lehrperson - wie gesagt 
... Gerade in Integrationskursen hat man ja oft mit schweren Schicksalen 
zu tun. (B04: 339-340) 


Die persönlichen Schilderungen aus der Lehrtätigkeit der Befragten B04 und 
B01/B02 lassen zudem schließen, dass die Anforderungen im DaZ-Bereich 
besondere persönliche Voraussetzungen, wie z.B. Selbstregulation und Durch- 
setzungsfähigkeit oder Mitgefühl erfordern (B04: 339-340, 329-335, 349-354), 
denn die Aufgaben ähneln hier häufig denen der Sozialarbeit (B02: 589-598), 
während diese bei Sprachvermittlungsaufgaben in lerngewohnten Gruppen 
nicht zwingend erforderlich sind. Die Aussagen hierzu vermitteln teilweise 
den Eindruck, der DaZ-Bereich leide deshalb bei einigen Befragten unter Sta- 
tus-Problemen und damit einhergehend unter einer eingeschränkten Bereit- 
schaft, sich auf die besondere soziale Situation dieser Kurse einzustellen (B02: 
458-461; B02: 589-598). 

Im Bereich personaler Kompetenzen wird außerdem die besondere Rolle 
der Reflexionskompetenz betont, denn diese ist Voraussetzung für die kriti- 
sche Betrachtung der eigenen persönlichen Eignung für den Lehrberuf (B03: 
354-356) und für die Auseinandersetzung mit den eigenen Einstellungen 
und Überzeugungen (B05: 381-404). Reflexion wird zudem als wichtige Basis 
zur realistischen Selbsteinschätzung (B06: 464-467; B06: 472-473) und da- 
mit auch als Keim sozio-emotionaler Intelligenz und prosozialer Haltungen 
betrachtet: 


Für mich persönlich ist Reflexionskompetenz ganz wichtig. Ich muss mich 
erst mal selbst kennen, bevor ich andere kennenlernen kann und auch 
wertschätzen kann. (B06: 472-473) 


Bei der Aufzählung der Kompetenzen, über die man idealerweise im Hinblick 
auf eine Lehrtätigkeit in DaF/DaZ-Bereich verfügen sollte, wurden von den 
Interviewten mehrheitlich insbesondere folgende soft skills genannt: soziale 
Kompetenz (7 Nennungen), interkulturelle Kompetenz und Ambiguitätsto- 
leranz (9 Nennungen), Empathie (6 Nennungen), Durchsetzungsvermögen 
(4 Nennungen), Prosozialität (4 Nennungen) und Offenheit (6 Nennungen): 


126 © Frank & Timme Verlag für wissenschaftliche Literatur 


Rolle sozialer und personaler Kompetenzen in DaF/DaZ-Eignungstests 


Tatsdchlich eine gewisse Offenheit anderen Menschen gegeniiber, also das 
was man vielleicht soziale Kompetenz nennen könnte, gehört ganz we- 
sentlich dazu. Und das können wir im Studium tatsächlich nicht wirklich 
vermitteln, oder nur in sehr geringem Maße. (B05: 459-462) 


Demgegenüber steht das überraschende Ergebnis, dass eine gezielte Überprü- 
fung dieser sozialen und personalen Kompetenzen jedoch nicht Gegenstand 
der meisten Auswahlgespräche ist, sondern nur in einem einzigen Fall nach 
vordefinierten Kriterien erfolgt. 


5.1.1 Soziale Kompetenzen sind wichtig, werden aber kaum geprüft 


Einzig B06 gibt an, im Auswahlgespräch die persönlichen Voraussetzungen 
der Bewerber*innen im Hinblick auf soziale Kompetenz und Eignung für den 
Lehrberuf formell zu prüfen (B06: 97-101; 183-184, 314-316, 326-328): 


[...] kann sie als Lehrkraft überzeugen? Hat sie eine offene Persönlichkeit? 
Also Offenheit ist uns sehr wichtig aufgrund unserer interkulturellen Situ- 
ation. Ist sie flexibel? Oder kann sie... ist sie motivierend? [...]. Und dann 
wird das von 40 Punkten schon mit 10 Punkten bewertet. (B06: 190-194) 


Wir schauen wirklich drauf: |...] kann diese Person den Beruf Lehrkraft 
erfüllen? Ist das Potenzial da? (B06: 383-385) 


Zu diesem Zweck steht B06 ein Kriterienkatalog zur Verfügung, der in die Blö- 
cke „Interessen und Kompetenzen“ (B06: 92) sowie „Sprache, Argumentation 
und Persönlichkeit“ aufgeschlüsselt ist, für die es jeweils eine klar definierte 
Punktevergabe gibt (B06: 79-82, 131-136). Dabei werden im Eignungsge- 
spräch die Bereiche Persönlichkeit, kommunikative Fähigkeiten und die Re- 
flexion interkultureller Aspekte und praktischer Vorerfahrungen besonders 
fokussiert (B06: 108-118, 184-185, 326, 180-181, 198-199, 201-202, 326). 
Das Gespräch erfüllt vor allem die Funktion, ein Gesamtbild der Bewer- 
ber*innen „als Person“ zu ermitteln (B06: 119-120; 374-377). Nach Angaben 
der Interviewten werden im Eignungsgespräch zahlreiche Dimensionen so- 
zialer und personaler Kompetenz berücksichtigt und positiv bewertet (B06: 
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190-194). Hierzu zählen Empathie (B06: 202-203), Flexibilität (B06: 192,338), 
ein selbstbewusstes, motivierendes Auftreten (B06: 192; 316-318; 335-336), 
Durchsetzungsvermögen (B06: 326-328), Sensibilität für Interkulturelles (B06: 
108-118, 201-202), Offenheit in Bezug auf Menschen und neue Erfahrungen 
(B06: 190-192, 409-412, 516-517) und Reflexionskompetenz (B06: 201-204, 
328-329). Besonders die Reflexion möglicher Vorerfahrungen (B06: 161-166) 
und die Auseinandersetzung mit den eigenen Fähigkeiten und Defiziten im 
Hinblick auf eine Lehrtätigkeit werden abgefragt, um die Reflexionsfähigkeit 
der Kandidat*innen zu testen (B06: 166-172). Belege für eine (pro)soziale 
Orientierung werden ebenfalls äußerst positiv bewertet (B06: 476, 511-518): 


Also was ganz wichtig bei uns auch ist: so was wie Ehrenamt. Wenn man 
sich im Ehrenamt engagiert hat, das zeigt für uns ja auch eine gewisse 
soziale Kompetenz. Das ist für uns eigentlich eher so das Wichtigste. (B06: 
100-102) 


Zudem erfüllen die kommunikativen Kompetenzen der Bewerber*innen eine 
gewichtige Rolle im Eignungsgespräch: 


Wie ist die Argumentation? Kann jemand Argumente formulieren? 
(B06: 178-181) 
Glauben wir, dass die Lehrkraft überzeugend ist? (B06: 189-189) 


Der explizite Wunsch von B06 nach mehr Zeit für das Eignungsgespräch und 
besseren Instrumenten zur validen Erfassung der sozialen Kompetenzen macht 
deutlich, welche Wichtigkeit die Bildungseinrichtung diesen Faktoren beimisst: 


Natürlich wäre es toll, wenn man so einen ganzen Tag, einen Assessment 
Center Tag hätte... (B06: 354-355) 


Die kurze Zeit von 15-20 Minuten erlaube allerdings nicht, differenzierte Aus- 


sagen über die Bewerber*innen zu treffen und verlässliche Entscheidungen 
über die Eignung der Bewerber*innen für den Lehrberuf zu fallen (B06: 352- 
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354; B06: 332-333). Weitere Kritikpunkte beziehen sich auf die rudimentären 
verwendeten Mittel zur Eignungsdiagnostik (B06: 319-321). 

Sinnbildlich für die Bedeutung sozialer und personaler Kompetenzen für 
diesen Studiengang steht der Erfahrungsbericht über einen Studierenden, der 
wegen einer betont arroganten Haltung, der Verwendung unangemessener 
Register und erheblichem Mangel an Interesse und sozialen Kompetenzen das 
Eignungsgespräch nicht bestanden hat (B06: 428-457). Dieser Erfahrungsbe- 
richt bestätigt jedoch auch, was sich m.E. aus dem ganzen Gespräch interpre- 
tieren lässt: Die Einrichtung würde das Eignungsgespräch im Zulassungspro- 
zess gern höher gewichten, als dies aktuell der Fall ist: 


„Wir bedauern das ist die... die Entscheidung liegt nicht bei uns“. (B06: 
224-230) 


Anders als bei B06 betonen die übrigen Interviewten, im Auswahlverfahren 
entweder soziale Kompetenzen überhaupt nicht zu prüfen (B01: 161-162, B02: 
508, B04: 20-23) oder zumindest nicht dezidiert zu prüfen. Zwar gibt B05 an, 
ein „Mindestmaß“ an sozialer Kompetenz bei den Bewerber*innen voraus- 
zusetzen (B05: 435-437). Diese Aussage erfolgt allerdings erst nach ausfor- 
schenden Nachfragen der Interviewerin und nicht spontan bei der Frage nach 
den wichtigsten Faktoren in Auswahlgesprachen (B05: 286-294). Anders als 
bei B06 erfolgt die Prüfung des „Potenzials an sozialen, interkulturellen und 
Vermittlungskompetenzen, Offenheit und Flexibilität“ der Kandidatinnen 
nicht gezielt und nach festen Kriterien, sondern besteht in einer eher situati- 
ven Bewertung. Nimmt man die zur Verfügung gestellten Erfahrungsberichte 
über Bewerber*innen als Grundlage, entsteht der Eindruck, dass diese Kom- 
petenzen und Einstellungen nicht positiv ermittelt werden, sondern erst ihr 
Fehlen negativ bewertet wird: 


Ich gehe in der Regel erst mal davon aus, dass Leute, die sich bei uns 
bewerben, eine gewisse grundsoziale Kompetenz mitbringen. Erst dann, 
wenn wir merken: da stimmt irgendwas nicht, dann wird man... kriegt 
auch schon ein bisschen große Ohren und kann dann auch nochmal ge- 
zielt dann nachhaken. Ja, das würden wir dann schon machen. Also spielt 
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eine Rolle, wenn jemand sich im Gespräch als sozial inkompetent heraus- 
stellt, weil er zum Beispiel überhaupt nicht auf Fragen eingeht. Dann wäre 
es ein Minuspunkt. Und ein ganz wichtiger. (B05: 494-500) 


Ähnliches geschieht im Fall B03. Auch hier lässt sich aus dem Gespräch nicht 
eindeutig erkennen, inwiefern persönliche Voraussetzungen als Auswahlkri- 
terien berücksichtigt werden. Auf Nachfrage wird jedoch bei beiden Inter- 
viewpartner*innen die enorme Bedeutung von Offenheit und Sensibilität für 
Interkulturelles insbesondere bei den binationalen Studiengängen bekräftigt 
(B03: 94-96; B05: 296-297; 299-302; 436-443; 302-309). 

Im Fall B03 wird ebenso die Wichtigkeit kommunikativer Fähigkeiten an- 
gegeben, die über die überzeugende Darstellung einer Aufgabe (Vermittlungs- 
kompetenz) im Auswahlgespräch getestet werden (B03: 198; B03: 163-165). 
Personale Kompetenzen wie Organisationskompetenz (B03: 264) und Ge- 
wissenhaftigkeit (B03: 239-241) werden auf gezielte Nachfrage ebenfalls als 
wichtig angeführt. Ähnlich wie bei B05 bleibt jedoch nicht ermittelbar, welche 
Gewichtung diese Faktoren bei der Auswahlentscheidung haben und ob bzw. 
wie diese erhoben werden. Denn sie werden nicht aktiv als Auswahlkriterien 
formuliert, sondern erst nach Ausforschen der Interviewerin bezüglich der 
Kompetenzen, die in Hinblick auf die Lehrtätigkeit vom Belang sind, ange- 
sprochen. 


5.1.2 Informelle Berücksichtigung der sozialen Kompetenzen 
mangels Erfassungsinstrumente? 

In der kritischen Auseinandersetzung mit dem Interviewmaterial lassen sich 

allerdings Indizien identifizieren, die Rückschlüsse auf eine eventuell situative, 

informelle Berücksichtigung von weichen Kriterien zulassen: 


Eine Person, die sich auch Gedanken macht über das, was zum Beispiel 
Lernerinnen und Lerner gerade fühlen, gerade denken ... Was die Lerne- 
rinnen und Lerner betrifft, wenn sie diesen DaF/DaZ unterrichten |...] 
Und dass man einfach fähig ist, auch sich in andere Personen hineinzuver- 
setzen zu wissen: Das ist nicht das Übliche, was ich hier gerade sehe. Wenn 
sowas auch im Bewerbungsgespräch deutlich wird, ist das von Vorteil. 
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I: Würden Sie dann Empathiefähigkeit im Auswahlgespräch prüfen oder 
würden Sie einfach...? 

B03: Wahrscheinlich nicht. Ich glaube nicht, dass man sowas prüfen kann. 
Da kann man fragen: „Bist du empathiefähig?“ Und dann sagt er: „Ja 
klaaaar!“. So geht es nicht. Ich glaube, es ist auch nicht zielführend. Wir 
können keine Situation schaffen, in der wir das gründlich testen können. 
(B03: 296-309) 


Diese und ähnliche Aussagen z.B. über die Wichtigkeit von soft skills und von 
einer zugewandten Haltung der Kandidat*innen (B04: 203-210; B05: 321-326; 
B05: 464-465) erlauben die Schlussfolgerung, dass die sozio-emotionalen und 
kommunikativen Kompetenzen der Bewerber*innen möglicherweise nur auf- 
grund mangelnder Erfassungsmöglichkeiten nicht als Auswahlkriterien for- 
muliert und nicht gezielt geprüft werden, jedoch bei positiven wie negativen 
Auffälligkeiten für die Entscheidung mitbewertet werden: 


I: Aber all diese [...] zum Beispiel soziale Kompetenz, würden Sie sie in 
einem Auswahlgespräch prüfen? [...] 

B05: Jaaa, also sagen wir so [...] wenn wir, wenn also [...] ganz wichtig 
bei solchen Gesprächen egal welche Art von Gesprächen, auch Prüfungs- 
gespräche, ganz wichtig ist: Habe ich den Eindruck, dass jemand mit dem 
ich spreche, überhaupt auf meine Fragen eingeht? (B05: 485-489) 


Es ist deshalb nicht auszuschließen, dass Beurteilungen nach dem Bauchgefühl 
erfolgen. Selbst die Bildungseinrichtung, deren Auswahlgespräche explizit auf 
die Prüfung der Lehreignung anhand personaler und sozialer Kompetenzen 
ausgerichtet waren, bedauerte, über keine ausgefeilten eignungsdiagnostischen 
Methoden für die Erfassung dieser Kompetenzen zu verfügen (B06: 319-321). 

Ein weiteres interessantes Ergebnis erscheint mir in diesem Zusammenhang 
die ausdrückliche Betonung der Bewertungsobjektivität im Auswahlverfahren. 
Diese wird nach Angaben der Interviewten durch die Expertise erfahrener 
Personen oder durch die Beteiligung mehrerer Entscheidungsbefugter aus dem 
Auswahlgremium sichergestellt (B01: 85-91; B03: 172-174; B04: 105-106; B06: 
185-189). In diesem Kontext wird zudem auf den ausschließlichen Bezug auf 
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klar definierte, harte Kriterien für die Auswahlentscheidung hingewiesen (B01: 
393-395; B03: 172-174; B04: 125-128). Geht es um weiche Kriterien, wird die 
Verwendung eines transparenten Kriterienkatalogs betont, an dem sich die 
Entscheidung orientiert: 


I: Wie bilden Sie sich im Gespräch Ihre Meinung? Welche... Indikatoren 
bewerten Sie positiv? 

B06: Also das hatte ich, glaube ich, auch erwähnt. Also wenn wir jetzt 
mal... Meinung im Sinne von... Was heißt Meinung? Wir haben ja unser 
Protokoll und daran orientieren wir uns. Das ist nicht nur eine Meinung, 
sondern ist unser Kriterienkatalog. (B06: 307-311) 


In Kontrast zu diesen Aussagen entsteht bei der Analyse der Aussagen ein zwei- 
tes Bedeutungsmuster. Hier deuten zahlreiche sprachliche Indizien (glauben, 
denken, sehen, fühlen) auf eine Bewertung nach Bauchgefühl hin: 


[...] ich glaube schon, dass wir ganz gut nachfragen können und sehen 
können, ob eine Person sich auseinandergesetzt hat mit etwas oder eine 
Person nur auswendig gelernt hat, was sie gerade kann. (B03: 137-139) 


Insbesondere, wenn es sich um die Beurteilung von soft skills oder anderen 
affektiven Faktoren wie Motivation handelt, werden Intuition und Gefühl als 
Instrumente für die Entscheidungsfindung angegeben: 


« Also... ja, feste Indikatoren habe ich persönlich dafür nicht. Ich könnte 
Ihnen nicht auflisten, das und das und das. Es ist sehr individuell und 
es kommt sehr auf die individuelle und spezifische Gesprächssituation 
an. Man spürt das. (B05: 348-353) 

e Haben wir das Gefühl, dass jemand Empathie hat und durch die Em- 
pathie diese Situation vielleicht bewerten kann? (B06: 202-203) 

« Also die Person geht raus und die wollen wir haben. Weil wir einfach 
denken, das ist eine offene, interessierte, motivierte Person. Egal, ob 
jetzt sehr eloquent oder eher zurückhaltend... Einfach so. Es ist eher so 
ein...tatsächlich ein Gefühl. (B06: 411-413) 
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Naja, wir wissen ja. Wir sind auch alle aus der Praxis und wir wissen 
ja auch, worauf es ankommt. Und ja, so versuchen wir, das zu bewerten 
[...] Wenn jemand motivierend erscheint und das kann man - glaube 
ich - auch nicht so richtig in Worte fassen - das ist halt vielleicht etwas 
Subjektives - das ist für uns auch schon auf jeden Fall ein Pluspunkt. 
(B06: 334-338) 


Die vermeintlich heikle Situation, aufgrund fehlender Kriterien für die Mes- 
sung weicher Faktoren (B06: 352-354) nach dem Bauchgefühl entscheiden 
zu müssen, lässt es aus meiner Sicht plausibel erscheinen, dass einige Befragte 
die Benennung von weichen Faktoren durchgängig vermeiden und sich lieber 
hinter eine strikte Orientierung nach harten Kriterien zurückziehen. Dies zeigt 
sich aus meiner Sicht besonders prägnant beim wiederholten Kleinreden der 
weichen Kriterien im Auswahlverfahren von B01, wo selbst das Motivations- 
schreiben zur Überprüfung der sprachlichen Kompetenz dient: 


Das Motivationsschreiben ist vor allen Dingen auch ein Einblick zum 
einen, wie sich die Leute natürlich selbst präsentieren, und auch was für 
einen Text sie in so einer Situation verfassen können. (B01: 139-141) 
Absolut ungeeignet ist nach den harten Kriterien. Also wer das gar nicht 
erfüllt. Das ist sozusagen eine rein technische Sache. (B01: 393-395) 

I: Sie haben „Einstellungen“ genannt. Haben Sie was im Kopf, welche 
Einstellungen diese sein könnten? 

B01: Nicht auf Anhieb, weil das keine KO-Kriterien sind. Also es ist nicht 
das, was wir suchen. (B01: 159-162) 


5.1.3 Das Motivationsschreiben 


Die Rolle des Motivationsschreibens (im Folgenden MS) wurde wegen seines 
potenziell affektiven Gehalts besonders in den Fokus dieser Untersuchung ge- 
nommen. Anders als vermutet, dient das MS jedoch nicht, um Rückschlüsse 
auf die Person zu ermitteln, sondern vor allem dazu, die Gründe für die Studi- 
enwahl festzustellen (B05: 116-119) und damit auch das Interesse/den Enthu- 
siasmus, mit dem die Studierenden ans Studium herangehen. Dies wird wegen 


© Frank & Timme Verlag für wissenschaftliche Literatur 133 


Virginia Sanchez Anguix 


der Ressourcen, die Motivation für die Bewältigung des Studiums mobilisiert, 
als wichtig betrachtet: „ob es so aussieht, dass sie das gut durchziehen können“ 
(B01: 302-306), selbst wenn durch die Studiengänge ein erhöhter Workload 
zu erwarten ist, wie es bei Doppelstudierenden der Fall ist (B06: 40-47). Mög- 
liche affektive Faktoren, die aus den Angaben im MS zu Rückschlüssen auf 
eine offene oder prosoziale Orientierung führen könnten, wie z.B. altruistische 
Gründe für die Studienwahl, werden nicht thematisiert. Damit konnte die Be- 
rücksichtigung sozialer Kompetenzen durch das Motivationsschreiben anhand 
der verfügbaren Daten nicht bestätigt werden. 


5.2 Die eigentlichen Auswahlkriterien: 
Fachliche Voraussetzungen 


Als Hauptziel aller Auswahlverfahren erweist sich vordergründig die Feststel- 
lung der Studierfähigkeit. Überraschend dabei ist, dass selbst die Interviews 
mit den Bewerber*innen überwiegend auf die Überprüfung der fachlichen 
Kriterien und der auf Studienfach und -ort bezogenen Motivation konzipiert 
sind, um die Studierfähigkeit „realistisch einzuschätzen“. 

In den Auswahlgesprächen werden mehrheitlich die Kenntnisse der 
Sprachwissenschaft und teilweise der Didaktik anhand von standardisierten 
Aufgaben zu Fehlerdiagnostik oder Syntaxanalyse sowie durch Fragen zu 
Grammatik- und Sprachtheorien getestet (B03: 84-90; B04: 106-107; B05: 
226-229). Die Sprachkompetenz wird in den Auswahlgesprächen ebenfalls 
gezielt und eingehend geprüft (B03: 324-327; B04: 128-129; B05: 71-72; B06: 
54-56; 205-212). 

In Zusammenhang mit diesem Ergebnis stehen nach Angaben der Inter- 
viewten vor allem wiederholt festgestellte Mängel an fachlichen und sprach- 
lichen Kompetenzen unter den Studierenden. Ein rekurrentes Motiv sind die 
Berichte über negative Erfahrungen mit Bewerber*innen aus dem Ausland. 
Insbesondere werden die für das Studium unzureichenden Deutschkenntnis- 
se beklagt (B01: 144-149; B02: 400-401; B03: 166-169; B04: 231-237; BOS: 
71-74). Ebenfalls bemängelt werden die lückenhaften sprachwissenschaftli- 
chen Grundkenntnisse der Bewerber*innen aus dem In- und Ausland (B02: 
278-279; B03: 324-331; B04: 144-146; B05: 230-234). 
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Die wiederholte Feststellung von Diskrepanzen und Abweichungen zwi- 
schen den durch Zeugnisse bescheinigten und den tatsächlich vorhandenen 
fachlichen und sprachlichen Kompetenzen der Studierenden erzeugt ein 
grundsätzliches Misstrauen der Institutionen gegenüber Sprachzertifikaten 
und sonstigen Zeugnissen (B03: 173-174; B04: 229-230; B05: 75-79; B05: 
234-236), das sich deutlich auch an den Andeutungen tiber die Unechtheit 
bzw. dubiose Herkunft der Zertifikate erkennen lässt (B03: 166-168; B05: 
75-79). Bedenkt man, dass so namhafte Sprachnachweise wie das DSH3 oder 
der TestDaF 4x4 für die Zulassung vorausgesetzt werden, erweist sich diese 
Problematik als besorgniserregend (B04: 72-76). 

Die Bildungsinstitutionen reagieren auf diese Problematik mit einer ein- 
gehenden eigenhändigen Prüfung der Sprach- und Fachkompetenzen und 
richten zu diesem Zweck „Auswahlgespräche“ ein als eine Art mündlicher 
Prüfungsersatz. Die Durchführung von Auswahlgesprächen folgt demnach 
der Logik des Misstrauens und, nicht wie angenommen, der Ganzheitlichkeit. 
Drei von vier Institutionen setzen Auswahlgespräche deshalb vor allem ein, um 
die Zuverlässigkeit/Echtheit der eingereichten Zeugnisse zu überprüfen und 
die Angaben aus den Bewerbungsunterlagen besser „einschätzbar zu machen“ 
(B03: 136-140; B04: 72-78; B05: 51-53). Auch bei der Institution ohne Aus- 
wahlgespräch dienen die Angaben im Motivationsschreiben laut Aussagen der 
Befragten der Begutachtung der Sprachkompetenz (B01: 139-141). Einzig B06 
verfolgt ein ganzheitliches Konzept, in dem versucht wird, ein gesamtes Bild 
der Bewerber*innen und ihrer Kompetenzen durch das Gespräch zu erhalten 
(B06: 119-120). 


5.3 Weitere Auswahlkriterien: 
Motivation und praktische Erfahrungen 


Werden die sozialen Kompetenzen nur in einem Fall formell vorausgesetzt und 
geprüft, so erfüllen die persönlichen Voraussetzungen Interesse und Motiva- 
tion eine ganz prominente Stellung als Auswahlkriterien bei fast allen Befrag- 
ten (B03: 61-63; B03: 74-77; B04: 98-101; B05: 117-119; B06: 391-397; B06: 
521-522). Vor allen Dingen interessieren sich die Institutionen für die Gründe 
der Studienwahl. Als motiviert gelten Bewerber*innen, die nachweislich ein 
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ausgepragtes Interesse an dem Fach DaF/DaZ zeigen, und zwar als Hauptfach 
(B01-B02: 359-366; B02: 337-340; B03: 198-200; B04: 101-105; B05: 145-150; 
B06: 150-153), und solche, die sich bereits in Voraus mit den spezifischen In- 
halten und Dozenten der konkreten Bildungseinrichtung auseinandergesetzt 
haben (B05: 80-87; B05: 214-216; B06: 154-159). Bei binationalen Studien- 
gängen wird dieses Interesse im Auswahlgespräch anhand des Bezuges zum 
Studienort (B03: 77-79) sowie einer überprüfbar eingehenden Befassung mit 
dem Zielland und seinen Besonderheiten gemessen (B03: 99-101; 143-147; 
239-242; B05: 299-302). 

Ausdrücklich betont wird auch die große Bedeutung von Praxiserfahrun- 
gen für die Auswahl. Denn diese erweisen sich den Angaben zufolge als Quelle 
wichtiger Erlebnisse, die mit dem Erwerb entscheidender Kompetenzen ein- 
hergehen (B03: 275-277; B03: 250-B05: 88-90; B05: 284-285; B05: 277-278; 
B06: 316-318). Einschlägige Erfahrungen in kultur- und sprachmittelnden 
Institutionen werden als festes Auswahlkriterium bei BO5 mit 20% der Ver- 
fahrensnote am höchsten bewertet (B05: 120-121). Diese Erfahrungen werden 
wegen ihres Wertes als Wissensgrundlage geschätzt, da sie zu einem besseren 
Verständnis und zur Verinnerlichung der fachdidaktischen Inhalte im Master 
führen (B05: 155-166; B05: 170-173). Eine große Rolle bei der Auswahl spielen 
vor allem Unterrichtserfahrungen, denn diese zeugen zudem vom grundsätz- 
lichen Interesse an der Lehrtätigkeit (B06: 160-162). Auslandserfahrungen 
gelten ebenfalls als lehrreich. Für die binationalen Master ist die Bedeutung von 
Auslandserfahrungen ebenfalls gewichtig für die Zulassung (B03: 275-277): 


Dass die Person schon einmal im Ausland war, finde ich auch sehr wich- 
tig. Dieser Master DaF ist kein Auslandstudium, das man machen sollte, 
wenn man vorher nicht im Ausland war. Da sind wir uns einig. Weil hier 
vieles erwartet wird, was man einfach nicht weiß, wenn man nicht vorher 
im Ausland war. (B03: 254-257) 


Auch organisatorische Tätigkeiten in sozialen Einrichtungen oder Kultur- 
institutionen werden als Ressource zum Ausbau relevanter personaler Kom- 
petenzen, wie z.B. von Selbstorganisation (B03: 250-253) oder sozialer Kom- 
petenzen, positiv bewertet (B06: 172-176). 
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Von den meisten Befragten wird zudem der Standpunkt geteilt, durch Er- 
fahrungen ließe sich am ehesten feststellen, ob die Eignung zum DaF- bzw. 
DaZ-Lehren vorliegt (B01: 429-437; B02: 536-539; B03: 354-356; B06: 329- 
332; B06: 585-587). Außerdem könne man durch Erfahrungen automatisch 
zu den erforderlichen Kompetenzen gelangen (B02: 488-495; B02: 532-533; 
B03: 266-274; B03: 347-354; B04: 306-312; B06: 329-332), was gegen eine 
frühzeitige Selektion nach persönlichkeitsrelevanten Kriterien der Studieren- 
den spreche: 


Das hat sich bei mir erst im Laufe meines ersten Studiums herausgestellt. 
Aufgrund eines Zufalls durch ein Auslandssemester, durch ein Praktikum 
am deutschen Institut habe ich gemerkt: HU! Deutsch zu unterrichten, 
macht ja total Spaß! Oder generell, dass ich gemerkt habe: Ich möchte 
gern mit Menschen arbeiten. (B06: 575-579) 


5.4 Haltung gegenüber eignungsdiagnostischen Verfahren’ 


Bei den meisten Befragten lässt sich eine ambivalente Haltung gegenüber der 
Einführung eignungsdiagnostischer Verfahren vor der Studienaufnahme fest- 
stellen. Einerseits zeigen sich alle Befragten bis auf B01 mehr oder weniger 
dezidiert offen und positiv (B02: 237-239; B03: 206-208; B05: 513) bis hin zu 
enthusiastisch (B04: 384-385; B06: 354-355) gegenüber eignungsdiagnosti- 
schen Verfahren, die eine Feststellung der persönlichen Eignung für Studium 
und spätere Lehrtätigkeit durch die Prüfung der sozio-kommunikativen Kom- 
petenzen und der berufsrelevanten Persönlichkeitsmerkmale zum Ziel haben. 
Die Idee einer Eignungsprüfung ausschließlich nach persönlichkeitsrelevanten 
Kriterien widerstrebt einzig B01: 


7 Hierzu zählen Verfahren zur Eignungsfeststellung, die sowohl Eigeneinschätzungen (z.B. 
durch Fragebogen) als auch Fremdeinschätzungen/-beobachtungen (z.B. Auswahlgespräche, 
AC) beinhalten können. 
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Ich weiß, dass es auf was anderes ankommt [...] da ist noch kein Wissen 
wirklich untergebracht. (B01: 556-560) 


Das Hauptargument fur die Selektion von Bewerber*innen mithilfe dieser Ver- 
fahren betrifft den großen Einfluss, aber auch die große Verantwortung, die 
Lehrkräfte im Hinblick auf die Lernenden haben: 


Das ist ja eigentlich eine super verantwortungsvolle Aufgabe, ja? Wissen 
zu vermitteln, Leute auf ihrem Weg zu begleiten, das ist Grundlage in 
der Schule, aber auch wenn wir neu Zugewanderte bekommen. Danach 
entscheidet sich deren ganzer Lebensweg so mit. Und man kann da un- 
heimlich viel „reißen“. Man kann aber auch gleich viel kaputt machen. 
Und deswegen finde ich schon, dass es wichtig ist, dass man Lehrer 
gescheit auswertet oder auswählt und nicht jeden das machen lässt. 
(B04: 395-401) 


Weitere Argumente für eine Eignungsprüfung sind einerseits die willkommene 
Möglichkeit, dadurch an die Bestgeeigneten zu gelangen (B06: 359-362), und 
andererseits die beschränkte Aussagekraft, die eine Selektion ausschließlich 
nach Noten liefert: 


Und was zählt bei zulassungsbeschränkten Studiengängen ist: 1. aus- 
schließlich die Abiturnote. Abiturnote sagt so wenig darüber, ob jemand 
ein guter Arzt wie darüber aus, ob jemand eine gute Lehrerin ist. Das ist 
ja völlig daneben. (B05: 513-517) 


Besonders positiv äußern sich zwei Befragte über einen möglichen Einsatz 
von Selbsterkundungs- und Selbsteinschätzungsverfahren, und zwar nicht als 
Selektionsinstrument, sondern als Mittel der Reflexion in unterschiedlichen 
Stufen der Lehrbildung (B02: 237-239; B02: 246-249; B06: 322-326; B06: 
549-552). 

Trotz der grundsätzlich positiven Einstellung der Akteur*innen in Bezug 
auf die Eignungsdiagnostik lassen sich vier Kritik-Muster oder Kritik-Themen- 
komplexe erkennen, die mehr oder weniger durchgängig vertreten werden. 
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Größtes Problem aus Sicht der Befragten ist der Mangel (bzw. Unkenntnis/ 
nicht Verfügbarkeit) an zuverlässigen Verfahren, die es erlauben würden, die 
ohnehin schwer greifbaren sozialen und personalen Kompetenzen der Be- 
werber*innen valide zu erfassen (B01: 546-549; B03: 304-306; B05: 525-528, 
B06: 503-507). Hier wird exemplarisch die „Blenderproblematik“ bei Bewer- 
ber*innen angeführt, die es verstehen, sich „gut zu verkaufen“ (B01: 546-549). 
Eine verlässliche diagnostische Validität der Verfahren wird deshalb auch als 
Bedingung für die Einführung solcher Verfahren angegeben. 


Von der Sache her finde ich es gut. Wenn man da ein aussagefähiges Kri- 
terium oder Kriterien und auch Messverfahren entwickeln könnte und sie 
dann auch implementieren könnte und dann auch entsprechend Personal 
hätte, das zu machen, dann fände ich es wunderbar. (B05: 525-528) 


Es bestehen außerdem gewisse Vorbehalte, Verfahren aus der Berufspsycho- 
logie („Business-Bereich“) wie z.B. ACs für den Bildungsbereich einzusetzen 
(B02: 249-251; B05: 510-512). Allgemeine Skepsis herrscht auch in Bezug 
auf die eingeschränkten Möglichkeiten, verlässlich solche Fähigkeiten und 
subjektiven Einstellungen, wie z.B. Offenheit oder Empathie, zu messen (B03: 
304-306; B05: 464-466; B06: 503-507). 

Besonders kritisiert von B02 und B06 werden eignungsdiagnostische Ver- 
fahren, wenn sie als Ziel die Selektion verfolgen (B02: 239-241; B06: 552-553). 
Der frühe Zeitpunkt der Selektion in der Entwicklung könnte Personen aus- 
sortieren, die sich zu einem späteren Zeitpunkt als geeignet erweisen oder 
durch Ausbildung und Praxiserfahrungen zu „tollen Lehrkräften“ werden 
(B02: 244-246; B06: 555-564; B06: 575-579). Als großer Nachteil der Eig- 
nungsdiagnostik wird außerdem der hohe zeitliche und personelle Aufwand 
genannt (B03: 208-211; B05: 519-525; B06: 322-323). 


5.5 Geringe Bewerber*innen-Zahlen 


Ein weiteres Motiv, das durch seine Rekurrenz in den Gesprächen auffällt, ist 
die Thematisierung der Bewerber*innenzahlen bei allen Befragten. Das mag 
im Kontext von Auswahlverfahren selbstverständlich und trivial erscheinen, 
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jedoch lassen sich auch hier bedeutungstragende Aussagen ausmachen, die der 
Einführung eignungsdiagnostischer Verfahren entgegenstehen könnten. Vor 
allem die allgemeine Sorge um geringe bzw. sinkende Bewerber*innenzahlen 
ist in vielen Gesprächen belegt (B01: 78-81; B02: 275-278; B04: 385-388; B06: 
B06: 364-365). Für die meisten Befragten ist die aktuelle Zahl der Bewer- 
benden oder die Furcht vor schwindenden Bewerber*innenzahlen sogar das 


57; 


einzige plausible Argument bzw. Gegenargument für oder gegen die Einfüh- 


rung von Eignungsprüfungen: 


Die interpretative Generalisierung dieser Aussagen führt an dieser Stelle zu 


der 


140 


e Ich glaube, die Frage kommt gar nicht auf, ob solche Verfahren bei uns 
angewendet werden. Ich glaube das... wir stehen da vielleicht gar nicht 
so dezidiert kritisch gegenüber, weil wir das noch nie mussten. Also die 
Frage hat sich nie gestellt bei uns. (B01: 271-273) 

e Da kommt auch noch dazu, dass wir noch nie diese 30 Plätze über- 
schritten haben. Wenn wir irgendwann überrannt würden, dann wür- 
den wir uns das vielleicht überlegen ((lacht)). Aber jetzt im Moment 
ist es eher noch so: Wir sind froh, wenn wir 30 gute Studierende haben 
(B02: 275-278) 

« I: Könnten Sie sich vorstellen, ein solches Auswahlgespräch auch für den 
nationalen Studiengang, Masterstudiengang, einzuführen? 

B03: Könnte ich mir auch vorstellen. Da wir aber NC-frei sind, ist das 
unnötig (B03: 190-192) 

« I: Sagen wir mal, wir hätten so viele Bewerber, wir hätten jedes Jahr 70 
Bewerbungen. Würde sich dann anbieten, solche...? 

B04: Ja, spätesten dann, auf jeden Fall. Dann sehe ich keinen anderen 
Grund, der dagegenspricht. (B04: 392-395) 

e Man muss aber einfach auch sagen, dass wir da ... Also es gibt sehr viel 
Konkurrenz auch zur Uni XY, was den Master DaF oder DaZ angeht, 
und sind uns dessen auch bewusst, dass jetzt... naja die Studieren- 
denzahlen allgemein abnehmen und wir auch die Leute nicht zu sehr 
abschrecken wollen. (B06: 355-359) 


These, dass die Akteur*innen Eignungsprüfungen und Auswahlgesprä- 
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che eher als Barriere oder Filter auffassen und ähnlich wie das Festlegen von 
NC ausschließlich als Mittel zur Steuerung steigender Bewerber*innenzahlen 
verstehen. Dabei werden die konstruktiven Möglichkeiten eignungsdiagnosti- 
scher Verfahren in den meisten Fällen verkannt, die als Gestaltungsinstrument 
kommender DaFlerInnen-Generationen genutzt werden könnten. 


6 Schlussfolgerungen, Implikationen für die Praxis 
und Desiderate 


Die subjektive, jedoch von praktisch allen Befragten geteilte Einschätzung, dass 
weiche Faktoren wie Empathie oder Offenheit zum DaF/DaZ-Lehren erfor- 
derlich sind, lässt an dieser Stelle den Schluss zu, dass alle Akteur*innen die 
Bedeutung sozialer und personaler Kompetenzen als berufsrelevante Werk- 
zeuge in DaF/DaZ-Lehrtätigkeiten anerkennen und somit als Faktoren der 
Lehreignung betrachten. Eine gezielte Prüfung der Lehreignung nach diesen 
Kriterien vor der Studienaufnahme erfolgt den Angaben zufolge jedoch in der 
Regel nicht bzw. nur in einem einzigen Fall. Bedenkt man, dass bei der Stich- 
probe fast alle DaF/DaZ-Bildungseinrichtungen vertreten waren, die ein face- 
to-face- Assessment für die Zulassung voraussetzen, kann behauptet werden, 
dass die sozialen und personalen Kompetenzen der Studienbewerber*innen 
keine nennenswerte Rolle in den Auswahlverfahren zu DaF/DaZ-Masterstu- 
diengängen spielen. 

Vielmehr - und anders als angenommen - zielen die Auswahlgespräche mit 
den Bewerber*innen überwiegend auf die Überprüfung fachlicher Kriterien 
wie Sprachkompetenz und Kenntnisse der Sprachwissenschaft, um die Studier- 
fähigkeit realistisch einzuschätzen. Dies wird mit der Skepsis gegenüber den 
vorgelegten Sprachnachweisen und Zertifikaten begründet, die auf wiederholt 
negative Erfahrungen mit fachlich und sprachlich sehr schwachen Studieren- 
den zurückgeführt wird. Eine eingehende Befassung mit dieser Problematik 
halte ich für notwendig, denn zahlreiche Aussagen der Befragten stellen ernst- 
hafte Fragen an die Zuverlässigkeit zahlreicher anerkannter Sprachprüfungen 
wie DSH, TestDaF oder die Goethe-Zertifikate. 
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Obwohl bei Auswahlgesprächen mehrheitlich fachliche Kriterien geprüft 
wurden, gab es zahlreiche Anhaltspunkte dafür, dass auch Aspekte sozialer 
Kompetenz in die Bewertung einfließen, auch wenn diese nicht explizit als 
Auswahlkriterien formuliert wurden. Dies galt insbesondere, wenn Auffal- 
ligkeiten im Sozialverhalten erkannt wurden. Die Befragten wiesen in diesem 
Zusammenhang häufig auf das Fehlen geeigneter Instrumente zur validen Er- 
fassung dieser Kompetenzen hin. 

Um diese Lücke zu schließen, erscheint es m.E. sinnvoll, die Übertrag- 
barkeit verschiedener, bereits bestehender eignungsdiagnostischer Verfahren 
für die Zwecke des DaF-/DaZ-Bereiches zu erforschen. Hierfür bieten sich 
die Instrumente zur Eignungsdiagnostik an, die für die Eignungsprüfung von 
Lehramtsstudierenden bereits vielerorts Anwendung finden. Hierzu zählen 
beispielsweise das smk72 (vgl. Frey & Balzer 2017), FIBEL (vgl. Kanning et al. 
2012), FIT (vgl. Schaarschmidt et al 2017), das bereits erwähnte CCT-Modul 
(vgl. Nieskens 2016) oder das Assessment Center Parcours (vgl. Hechinger & 
Seibert 2015). Diese Instrumente? bieten eine objektive Bewertungsgrundlage, 
auf die zur Überprüfung wichtiger Kriterien der Lehreignung zurückgegriffen 
werden könnte. 

Eine solche Eignungsprüfung könnte aus meiner Sicht außerdem den 
positiven Effekt einer Aufwertung der DaF/DaZ-Studiengänge haben. Denn 
der hierfür betriebene Aufwand und die intensive Beschäftigung mit den per- 
sönlichen sozialen Fähigkeiten, Motivationen, Interessen und Einstellungen 
signalisieren den Bewerber*innen zum einen, dass auch diese Kompetenzen 
für ihr Berufsziel erforderlich sind, und zum anderen, dass sie als Individuen 
wahrgenommen werden. Dass Auswahlgespräche tendenziell als wertschät- 
zend empfunden werden, wurde auch durch einen Erfahrungsbericht aus die- 
ser Untersuchung bestätigt (B06: 253-260). Den geäußerten Befürchtungen 
über einen abschreckenden Effekt eignungsdiagnostischer Verfahren (B04: 
379-390; B06: 356-364) steht die Beobachtung zweier Befragter entgegen, 
dass Auswahlgespräche vor allem ungeeignete Bewerber*innen abschrecken 
(B04: 129-135; B06: 45-461). Als Aufwertung könnten eignungsdiagnostische 


8 Eine Zusammenstellung der beim Lehramt eingesetzten eignungsdiagnostische Instrumente 
findet sich bei Renger et al. 2019. 
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Verfahren m.E. sogar umgekehrt einen positiven Einfluss auf die Bewerber*in- 
nenzahlen haben. 

Der eigentliche Nutzen solcher umfassenderen Eignungsprüfungen bei der 
Studienaufnahme aber bestünde aus meiner Sicht nicht nur darin, geeigne- 
te Studierende herauszufiltern, sondern vielmehr in der Möglichkeit, schon 
von Beginn an für die Wichtigkeit sozio-emotionaler Kompetenzen und pro- 
sozialer/offener Einstellungen zu sensibilisieren. Außerdem könnten dabei 
bestehende Potenziale, Stärken und Defizite der Bewerber*innen identifiziert 
werden, um sie zur kritischen Selbstreflektion nutzbar zumachen und während 
der Ausbildung systematisch zu bearbeiten. Beruflich-perspektivisch wären die 
so ausgebauten sozialen Kompetenzen unabhängig von der späteren Berufs- 
wahl ohnehin als Schlüsselqualifikationen vom Belang und auch im Hinblick 
auf ein lebenslanges Lernen für eine gesundheitsbewusste, zukunftsorientierte 
Lebensgestaltung wichtig (vgl. Amtsblatt der EU 2018: C219/4). 
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Die medizinische Fachsprachenpriifung - 
Eine Pilotstudie zur Evaluation durch die Teilnehmenden 


Einleitung 


[...] Die Gesundheit und das Wohlergehen meiner Patientin oder mei- 
nes Patienten werden mein oberstes Anliegen sein [...]. Ich werde nicht 
zulassen, dass Erwägungen von Alter, Krankheit oder Behinderung, 
Glaube, ethnischer Herkunft, Geschlecht, Staatsangehörigkeit, politi- 
scher Zugehörigkeit, Rasse, sexueller Orientierung, sozialer Stellung 
oder jeglicher anderer Faktoren zwischen meine Pflichten und meine 
Patientin oder meinen Patienten treten [...]. (Auszug der Deklaration 
von Genf, Stand 2017) 


Dieses Zitat ist ein Auszug aus der Genfer Deklaration, welche in Anlehnung 
an den hippokratischen Eid der 2. Generalversammlung des Weltärztebundes 
erstmals im Jahr 1948 verabschiedet wurde (vgl. Bundesarztekammer 2017). Es 
verdeutlicht die Haltung und Werte, nach welchen Mediziner*innen handeln 
sollen und stellt eine unabdingbare Grundvoraussetzung für die Ausübung 
eines medizinischen Berufes dar. Eine gewissenhafte Ausübung und das Nach- 
kommen der genannten ärztlichen Pflichten sind jedoch nicht ohne kompeten- 
te und fachspezifische Sprachkenntnisse sowie (inter)kulturelle Kompetenzen 
möglich. Dies ist im Besonderen für ausländische Ärzt*innen oft eine Hürde 
(vgl. bspw. Schrimpf, Bahnemann & Lecher 2019: V). 

In der Bundesrepublik Deutschland herrscht, neben einem allgemeinen 
Fachkräfteengpass im Gesundheits- und Pflegewesen (vgl. BfA 2019: 6), ein 
Ärzt*innenmangel, wie auch die Zahlen der Ärztestatistik 2019 belegen (vgl. 
Bundesärztekammer 2019). Mediziner*innen aus dem Ausland können diesen 
Bedarf decken (vgl. BAMF 2015: 5, 21f.) und Fachkräfte werden aus diesem 
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Grund gezielt angeworben (vgl. Hoesch 2003: 112) - dies bedeutet jedoch 
gleichzeitig, dass Maßnahmen für die sprachliche Ausbildung sowie zur Über- 
prüfung der für die Berufsausübung notwendigen Sprachkenntnisse dieser 
Zielgruppe gegeben sein müssen. 

Im Rahmen der 87. Gesundheitsministerkonferenz 2014 wurde bezüglich 
der Sprachkenntnisse ausländischer akademischer Heilberufe beschlossen, 


[...], dass Personen, die in Deutschland in einem verkammerten akade- 
mischen Heilberuf tätig werden wollen, über ausreichende Kenntnisse 
sowohl der deutschen Umgangssprache als auch der medizinischen 
Fachsprache verfügen müssen [...] (2014: 2). 


So sind fachspezifische Sprachkenntnisse nicht nur Voraussetzung für den 
(späteren) Berufsalltag als Ärztin oder Arzt, sondern der Nachweis dieser im 
Rahmen der Berufsanerkennung durch das Ablegen einer berufsspezifischen 
Fachsprachenprüfung (kurz: FSP) gesetzlich vorgeschrieben. Dies obliegt 
vornehmlich den Ärztekammern der Bundesländer. Aufgrund der kaum zu- 
gänglichen Datenlage in Bezug auf die Konzeption, den Ablaufetc. dieser Prü- 
fungen seitens der Landesärztekammern, um festzustellen, ob es sich bei den 
vorhandenen Formaten um valide Nachweise medizinischer Sprachkenntnisse 
handelt, stellen die Prüfungsteilnehmenden (TN) eine wesentliche Informati- 
onsquelle dar, um eine ‚Innenperspektive‘ der FSP zu erhalten. 

Ziel dieses Artikels ist daher eine erste Evaluation der ärztekammerlichen 
FSP aus der Sicht der TN, welche mithilfe einer online durchgeführten Um- 
frage ermittelt wurde. Dafür wird zunächst die aktuelle Situation ausländi- 
scher Ärzt*innen in der Bundesrepublik Deutschland in den Blick genom- 
men, wobei ein Unterkapitel (1.1) den gesetzlichen Weg zur Anerkennung im 
Ausland erworbener medizinischer Berufsqualifikationen zur Erteilung der 
Approbation bzw. Berufserlaubnis in der BRD darstellt. Die anschließend in 
Kapitel 2 angeführten Besonderheiten medizinischer Kommunikation und die 
Komplexität der Kompetenzen verdeutlichen den Umfang der Anforderungen 
dieses Berufsfelds und die damit verbundenen (sprachlichen) Hürden beson- 
ders für ausländische Ärztinnen. Im dritten Kapitel folgt die Vorstellung der 
Fachsprachenprüfung der Bezirksärztekammer Rheinhessen, deren Aufbau 
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exemplarisch fiir das im Bereich Medizin etablierte Priifungsformat seitens der 
Arztekammern herangezogen wird'. Der Aufbau der Online-Umfrage sowie 
die Perspektive der Prüfungsteilnehmenden werden in Kapitel 4 anhand der 
Umfrage-Ergebnisse präsentiert und abschließend diskutiert. 


1 Zur Situation ausländischer Ärztinnen und Ärzte 
in Deutschland 


Die Notwenigkeit eines gut funktionierenden Gesundheitssystems wurde 
durch die Corona-Pandemie verdeutlicht, aber auch sonst sind „Ärztinnen 
und Ärzte [...] systemrelevant“ (Ärztestatistik 2019), dies betonte auch der 
neue Bundesärztekammer-Präsident Dr. Klaus Reinhardt. Die derzeitige Ar- 
beitsmarktsituation und aktuelle Prognosen weisen jedoch eine erhöhte Nach- 
frage u.a. bei Gesundheits- und Pflegeberufen auf (vgl. BfA 2019, Augurzky 
& Kolodziej 2018: 31). Darunter fallen auch Haus- und Fachärzt*innen der 
Humanmedizin (vgl. ebd. und Abb. 1). 


@ 2020 @ 2030 


et fig tableau = 


Abb. 1: Prognose zum Fachkräfteengpass in gesundheitswirtschaftlichen Berufen in 
Deutschland bis zu den Jahren 2020 und 2030 (Daten aus dem Jahr 2016, veröffentlicht 2020) 


1 Vgl. auch Jehle in diesem Band. 
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Der immer wieder diskutierte bundesweite Fachkraftemangel (vgl. bspw. BfA 
2019, Deppe & Borowski et al. 2015: 10) wird für diesen Berufsbereich kurz 
skizziert, da dieser letztlich den Grundstein der in diesem Beitrag thematisier- 
ten Fachsprachenpriifung darstellt. 

In der Bundesrepublik Deutschland herrscht trotz der leicht steigenden 
bzw. gestiegenen Arzt*innenzahl ein Arzt*innenmangel, wie die Zahlen der 
jahrlich erhobenen Studien der Bundesarztekammer belegen (vgl. Arztestatis- 
tik 2019), da sich u.a. aufgrund der steigenden Lebenserwartung „die Schwere 
zwischen Behandlungsbedarf und Behandlungskapazitäten immer weiter [6ff- 
net]“ (Montgomery 2017, zit. in Ärztestatistik 2016). Dies schafft einen Anreiz 
für ausländische Fachkräfte zum Arbeiten nach Deutschland zu kommen und 
birgt die Chance, den nicht gedeckten Bedarf mit qualifizierten Fachkräften aus 
dem Ausland zu kompensieren und diese Versorgungslücke gar zu schließen 
(vgl. BAMF 2015: 5, 21f.). 

Zwar lassen sich für die Berufsgruppe der Ärzt*innen weder eindeutige 
Push- und Pull-Faktoren nach dem gleichnamigen Modell von Everett S. Lee? 
anführen, noch gibt es aktuell statistische Erhebungen über die Zuwande- 
rungsgründe von Mediziner*innen. Doch zeigen die aktuellen Zahlen der Bun- 
desärztekammer einen starken Zuwachs von Mediziner*innen: In Deutschland 
waren im Jahr 2019 insgesamt 58.168 ausländische Ärztinnen gemeldet, was 
einen Anstieg um rund 3.800 zum Vorjahr bedeutet (+7,0%). Dabei kommt die 
größte Zahl aus Syrien (4.486), Rumänien (4.433), Griechenland (2.811), Ös- 
terreich (2.381) und der Russischen Föderation (2.321) (vgl. Bundesärztekam- 
mer 2019: 36ff.). Insgesamt sind knapp 23.300 aller berufstätigen ausländischen 
Ärzt*innen aus der EU, wenn man ganz Europa betrachtet, sind es rund 33.000. 


2 Das sog. ‚Push-Pull-Modell‘ beschreibt zwei Beweggründe für Migration: Menschen können 
von ihrem bisherigen Wohnort ‚weggedrückt werden‘ (englisch.: „to push“; deutsch: „drü- 
cken“) und bzw. oder von einem anderen Gebiet ‚angezogen‘ (englisch: „to pull’, deutsch: 
„ziehen“) werden (vgl. Winter-Heider 2009: 182). Demnach wird die Aussicht auf bessere Bil- 
dungschancen, soziale Sicherheit, eine attraktivere wirtschaftliche Situation oder auf bessere 
Gesundheitsversorgungsysteme als Pull-Faktoren definiert. Migrationsbewegungen aufgrund 
von Krieg, Gewalt, Verfolgung, Diskriminierung, wirtschaftlicher Armut, sozialpolitischen 
Problemen oder persönlicher Konflikte im Herkunftsland gelten, wie auch der Nachzug als 
Familienmitglied, als Push-Faktoren (vgl. ebd.: 183). 
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Dies ist nicht zuletzt auf die Richtlinien der Anerkennungsverfahren zurück- 
zuführen, da hier zwischen EU- und Nicht-EU-Abschluss unterschieden wird. 

Um den (neuen) Herausforderungen des deutschen Gesundheitssektors 
und der beschriebenen Personalnot entgegenzuwirken, kommt es auch zur be- 
reits erwähnten gezielten Anwerbung ausländischer Fachkräfte, da „gerade in 
einer kurz- und mittelfristigen Perspektive [...] die Anwerbung von [Ärzt*in- 
nen] aus dem Ausland als Option der Personalpolitik in Betracht gezogen wer- 
den [muss]“ (Hoesch 2003: 112). Dies betrifft ebenso den Bereich der Pflege: 
Im Jahr 2015 beschäftigten bereits 21,8 Prozent der deutschen Krankenhäuser 
Pflegekräfte aus dem Ausland (vgl. statista 2019). Dabei werden unterschiedli- 
che Formen der Personalgewinnung genutzt: Neben Stipendienprogrammen 
für ausländische Medizinstudierende sowie approbierte Arzt*innen, Klinik- 
modellen zur konkreten Anwerbung, beauftragte Personaldienstleister*in- 
nen bzw. -vermittler*innen im In- und Ausland und Direktansprachen an 
Universitäten im Ausland (vgl. Adam & Croneberg 2012: 95, Vormweg 2012: 
93), existiert auch ein ausgeweitetes Internetmarketing (vgl. Baumhove 2012: 
96). So wirbt bspw. die private Sprachschule ‚Rheinland Institut‘ mittels On- 
line-Recruitment‘-Videos’ mit der Jobvermittlung in einem deutschen Kran- 
kenhaus sowie der Unterstützung beim vollständigen Anerkennungsprozess 
(vgl. Rheinland Institut). 

Das Anliegen seitens der Politik an einer verbesserten wirtschaftlichen Ein- 
bindung von Fachkräften mit Auslandsqualifikationen und die Integrationsför- 
derung waren Ausgangspunkt gesetzlich geregelter Anerkennungsverfahren, 
die die Voraussetzung zur Arbeit als Ärztin bzw. Arztin Deutschland festlegen. 
Diese werden im Folgenden erläutert. 


1.1 Der Weg zur Approbation 


Angesichts der oben dargestellten Situation stellt sich die Frage, wie medizi- 
nisch ausgebildetes Fachpersonal aus dem Ausland überhaupt in diesem Be- 


3 Vgl. ‚Doctor online recruiting in Germany, abrufbar unter: https://www.youtube.com/watch? 
v=CaRiQBL-suOE&t=1 1s&fbclid=IwAR26LFmj2jqB7Zk8pfP QCNU-Na954ODHI4UK-W- 
w4lhIgUkRmB_Vnk3bbIU, 20.07.2020. 
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reich tätig werden kann bzw. wie Ärzt*innen mit ausländischen Berufsquali- 
fikationen die Approbation bzw. Berufserlaubnis* in Deutschland erhalten. 
Hierfür spielt sowohl die fachliche Anerkennung also auch der Nachweis fach- 
spezifischer Sprachkenntnisse eine große Rolle. Für ersteres dient das im April 
2012 in Kraft getretene Gesetz über die Feststellung der Gleichwertigkeit von 
Berufsqualifikationen, kurz Berufsqualifikationsfeststellungsgesetz - BQFG (vgl. 
bp-Portal) als Grundlage. Bei der Gleichwertigkeitsprüfung des Abschlusses 
wird danach unterschieden, ob dieser in der EU bzw. EWR oder in der Schweiz 
absolviert wurde oder in einem nicht-europäischen Ausland (s. Anhang). Ein 
nicht-europäischer Abschluss zieht nach Antragstellung bei der zuständigen 
Behörde des jeweiligen Bundeslandes einen deutlich längeren bürokratischen 
Prüfweg nach sich (vgl. Dippold-Schenk 2018: 34), wohingegen für die in der 
EU erworbenen Qualifikationen eine sofortige Erteilung der Approbation in 
Deutschland möglich ist (vgl. ebd.). Beabsichtigt man nach Erhalt der Appro- 
bation die Anerkennung seines Facharztes, folgt ein weiterer Antrag und eine 
Eignungs- oder Kenntnisprüfung bei der Landesärztekammer (vgl. Informa- 
tionsportal der Bundesregierung). 

Die Finanzierung der Antragsstellung und ggf. Anpassungsqualifizierun- 
gen ist kostspielig. Außerdem gibt es je nach Bundesland spezifische Umset- 
zungsregelungen, was eine komplette Vereinheitlichung erschwert. Dennoch 
lässt sich sagen, dass das in Krafttreten des BQFGs ein erster Erfolg auf dem 
Weg zur verbesserten und vereinfachten Anerkennung ausländischer Berufs- 
qualifikationen darstellte (vgl. Braun 2012: 10). Darüber hinaus wurde für 
die Gewinnung qualifizierter Fachkräfte am internationalen Arbeitsmarkt im 
März 2020 das neue Fachkräfteeinwanderungsgesetz (FEG) erlassen, um so den 
Arbeitszugang aus Staaten außerhalb der EU zu erweitern und zu erleichtern 
(vgl. BMAS 2020). 

Neben der Anerkennung fachlicher Qualifikationen sind wie bereits er- 
wähnt fachspezifische Sprachkenntnisse zur Ausübung des jeweiligen Berufs 
unerlässlich. Anlässlich der 87. Gesundheitsministerkonferenz 2014 (GMK) 


4 Mit einer Berufserlaubnis kann im Krankenhaus oder einer Praxis gegen Bezahlung gearbeitet 
werden (max. zwei Jahre). Eine Weiterbildung zu einer Facharztqualifikation ist erst nach 
Erhalt der Approbation möglich (vgl. BÄK 2020a: 2). 
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wurde im Hinblick auf fachspezifische Sprachkenntnisse von akademischen 
Heilberufen Folgendes festgestellt: 


In der Praxis hat sich jedoch gezeigt, dass die insoweit von Sprachinstitu- 
ten angebotenen allgemeinsprachlichen Zertifikate und Diplome fiir die 
Überprüfung der für die Berufsausübung erforderlichen Sprachkennt- 
nisse nicht geeignet sind (87. Gesundheitsministerkonferenz 2014: 2). 


Ferner wurde im Beschluss dieser Konferenz festgehalten, dass von inter- 
nationalen Ärzt*innen neben allgemeinsprachlichen Sprachkenntnissen auf 
B2-Niveau (GER) auch fachspezifische Sprachkenntnisse auf C1-Niveau (GER) 
nachzuweisen sind (vgl. ebd.: 3). 

Mit dem Inkrafttreten des obigen Beschlusses entstand der Bedarf an Über- 
prüfungsmöglichkeiten der geforderten medizinischen Fachsprache und somit 
an einer Fachsprachenprüfung (FSP). Der Entwicklung von Deutsch-Prüfun- 
gen im Bereich Medizin nahm sich als Institution die telc gGmbH an, wobei 
die Durchführung in erster Linie an die Landesärztekammern in ‚Eigenregie‘ 
übertragen wurde. Hierzu ist vermerkt, dass „[d]ie Länder [...] dabei eine 
bundeseinheitliche Vorgehensweise an[streben]“ (87. GMK 2014: 7), was sich 
in der Praxis aber als schwierig erweist. Dies hängt u.a. mit der Komplexität 
der (Sprach)Kompetenzen und dem Umfang der Anforderungen an dieses 
Berufsfeld und letztlich auch mit den Anforderungen an eine solche FSP zu- 
sammen. Bevor auf die FSP eingegangen wird, erfolgt ein Überblick über die 
Besonderheiten der medizinischen Kommunikation. 


2 Besonderheiten und Kompetenzen 
der medizinischen Kommunikation 


Medizinische Kommunikation ist durch eine Vielfalt an Kommunikationse- 
benen, -formen und -situationen gekennzeichnet, an denen sowohl Ärzt*in- 
nen und Patient*innen als auch medizinisches Fach- bzw. Assistenzpersonal 
und Angehörige beteiligt sind (vgl. Roelcke 2005: 193). Außerdem kommt es 
im medizinischen Bereich, beispielsweise im Krankenhaus, oft zu fachdiszi- 
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plinübergreifender Zusammenarbeit, was eine Verständigung sowohl auf der 
berufs- als auch auf der fachsprachlichen Ebene zwischen Mediziner*innen 
bedeutet. Je nach beteiligten Personen und Kontext muss die Arztin/der Arzt 
also auch ihre/seine Sprache an die Situation anpassen. Dadurch entsteht ,,ein 
Spannungsfeld“ (Efing 2014: 420) zwischen der Lebens- bzw. Ausdruckswelt 
der Patient*innen und einem professionellen Umgang mit medizinisch wis- 
senschaftlichen Themen (vgl. Schrimpf & Bahnemann 2009: VI). Eine einheit- 
liche Kommunikationsform von Arzt*innen lasst sich damit nicht definieren. 
Dies bedeutet, dass in Deutschland tatige auslandische Mediziner*innen alle 
Kommunikationsebenen beherrschen miissen (vgl. ebd.), nicht zuletzt aus dem 
Grund, da „Kommunikationsfehler [...] im medizinischen Bereich - anders als 
im alltäglichen Leben - nicht nur ärgerlich, sondern [...] auch gefährlich“ sein 
können (Bechmann 2014: IX). „Mehr als 80% der medizinischen Fehlbehand- 
lungen gehen nicht auf unzureichende Fähigkeiten, sondern auf mangelhafte 
Kommunikation zurück“ (Baller & Schaller 2017: 162), so ist das Patienten*- 
wohl und die Patienten*sicherheit nachdrücklich durch Kommunikationser- 
folg bestimmt und dies nicht nur bei der Notfallbehandlung (vgl. ebd.: 7). 
Darüber hinaus belegen wissenschaftliche Studien die Wichtigkeit ärztlicher 
Kommunikation, da ein signifikanter Zusammenhang zwischen dem Heilungs- 
prozess und dessen Beeinflussung durch die medizinische Kommunikation be- 
stehe (vgl. Ärztekammer Nordrhein 2015: 5). Das Gespräch zwischen Ärztinnen 
und Patient*innen erfüllt folglich „vielfältige Funktionen im diagnostischen und 
therapeutischen Prozess“ (Langer & Schnell 2009: 7). Hinzu kommen kulturel- 
le Unterschiede z.B. im Umgang mit Patient*innen und Vorgesetzten, mit dem 
deutschen Versicherungs- und Verwaltungssystem, den Hierarchiestrukturen 
innerhalb von Krankenhäusern und allgemein mit dem deutschen Gesundheits- 
wesen (vgl. Schrimpf & Bahnemann 2009: VID. Dies verdeutlicht die großen 
Herausforderungen, denen sich ausländische Mediziner*innen auch sprachlich 
stellen müssen. Obwohl es schwer ist, klare Grenzen bei der Verwendung von 
Alltags-, Berufs- und Fachsprache zu ziehen und die Übergänge oftmals fließend 
sind (vgl. Efing 2014: 420), hat sich in der Praxis gezeigt, dass auf die Aneignung 
bzw. Vermittlung von fachspezifischen Sprachkenntnissen dennoch besonderer 
Wert gelegt werden muss (vgl. 87. GMK 2014: 2, Kapitel 2.1), da diese in der 
mündlichen wie schriftlichen Kommunikation u.a. spezifische „Mitteilungsstruk- 
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turen“ aufweisen (Buhlmann & Fearns 2000: 12). Dies äußert sich beispielsweise 
in der häufigen Verwendung von Abkürzungen und Wortableitungen, wie Reha 
für Rehabilitation oder EKG für das Elektrokardiogramm, von speziell im medi- 
zinischen Kontext immer wieder gebrauchten Redewendungen wie „Was machen 
die Schmerzen heute?“, „Ich taste nun ... ab“, „Liegt der Befund von ... vor?“ 
(Thommes & Schmidt 2016) oder im Formulieren fachlicher Informationen (z.B. 
in einem Arztbrief). Die verschiedenen Textsorten der medizinischen Fachkom- 
munikation (z.B. Fallberichte, Arztbriefe, Handbücher) sind hierbei durch eine 
„ausgeprägte Makrostruktur“ (Roelcke 2005: 194) gekennzeichnet und dienen 
der/dem jeweiligen Adressat*in zur „zuverlässigen Orientierung“ (ebd.).° 

Die Sprachkompetenzen, die im Bereich Medizin notwendig sind, lassen 
sich in die verschiedenen Fertigkeiten Hören, Lesen, Schreiben und Sprechen 
unterteilen. Für eine einheitliche und nachvollziehbare Bewertung des Sprach- 
niveaus gibt es nach dem GER sechs Niveaustufen. Gemäß dieser Einteilung 
sind für jede Fertigkeit und Niveaustufe allgemeine Kann-Beschreibungen 
formuliert worden, die festlegen, was man ‚können‘ muss, um ein gewisses 
Sprachniveau zu beherrschen (vgl. GER). Wie in Kapitel 1 bereits erwähnt, 
sind allgemeinsprachliche Kompetenzen für den medizinischen Bereich den- 
noch nicht ausreichend. So wurden spezielle Kann-Beschreibungen für Me- 
diziner*innen angefertigt. Dafür wurden die Stufenbeschreibungen der Glo- 
balskala des GER dem medizinischen Kontext angepasst und es wurde damit 
versucht, eine Antwort auf die Frage „Was können Ärztinnen und Ärzte auf 
den Kompetenzstufen B2 und C1?“ (telc) zu geben. 

Die Ausführungen dort’ zeigen die Komplexität der medizinischen (Fach-) 
Sprache und den vielseitigen Kommunikationseinsatz von Mediziner*innen, 


5 Fiir eine ausführlichere Erläuterung der spezifischen Merkmale der medizinischen Fachspra- 
che vgl. Roelcke 2005: 193ff. 


6 Das vorgestellte Sprachniveau B2-C1 wurde bewusst gewählt, da es sich dabei um die Kompe- 
tenzstufen handelt, die zur Anerkennung im Ausland erworbener fachlichen Qualifikationen 
im medizinischen Bereich und zum Erhalt der Approbation in Deutschland vorausgesetzt 
wird (vgl. Kapitel 2.1). 

7 Für eine zusammenfassende Darstellung vgl. Jehle 2019: 47f. Die vollständige Beschreibung 
der Kompetenzen von telc sind unter folgendem Link zu finden: https://www.telc.net/file- 
admin/user_upload/Broschueren/ger_poster_medizin.pdf, 21.07.2020. 
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dessen Beherrschung durch eine abzulegende FSP überprüft werden soll. Im 
Folgenden wird diese am Beispiel des Landes Rheinland-Pfalz skizziert. 


3 Arztliche Fachsprachenpriifung Rheinland-Pfalz 


Die Konzeption und Durchführung der FSP erfolgt vorwiegend durch die Lan- 
des- bzw. Bezirksärztekammern des jeweiligen Bundeslandes. Ein einheitliches 
Prüfungssystem existiert bisweilen nicht? (vgl. Malakhova & Lenz 2018), den- 
noch bestehen aufgrund der Beschlüsse der 87. Gesundheitsministerkonferenz 
grundlegende Vorgaben zu den Inhalten. So sind mindestens ein Arzt*-Patien- 
ten*-Gespräch (Anamnese), das Verfassen eines Schriftstücks (Kurz-Arztbrief) 
und ein Arzt*-Arzt*-Gesprach (Patienten*vorstellung) Bestandteile einer FSP 
(vgl. 87. GMK 2014: 6). 

Die ärztliche Fachsprachenprüfung in Rheinland-Pfalz (RLP) wird im Auf- 
trag der Landesärztekammer Rheinland-Pfalz und des Landesamtes für Sozi- 
ales, Jugend und Versorgung (LSJV) in Koblenz von der Bezirksärztekammer 
Rheinhessen durchgeführt. Die dort durchgeführte Prüfung ist die einzige in 
RLP zur Beantragung der Approbation bzw. Berufserlaubnis anerkannte FSP 
(vgl. Marburger Bund 2018: 4). Der Wohnort bzw. der offizielle Wohnsitz oder 
das Nachweisen eines konkreten Stellenangebots ist Bedingung für das Able- 
gen der Prüfung in RLP bzw. im jeweiligen Bundesland. Die Anmeldung zur 
Prüfung ist nur nach Erhalt einer qualifizierten Eingangsbestätigung des LSJV 
in Koblenz im Zuge der Beantragung auf Approbation bzw. Berufserlaubnis 
möglich, außerdem sollte ein Sprachzertifikat vorliegen.’ Das Niveau (nach 
GER) ist hierbei nicht spezifiziert. 

Nach erfolgreicher Anmeldung erwartet die Prüfungsteilnehmenden eine 
2,5-3 stündige Absolvierung (inkl. Wartezeiten) mit folgenden fünf bzw. sechs 


8 Siehe dazu den Beitrag von Jehle in diesem Band. 


9 Hier liegt eine deutliche Diskrepanz zwischen der Auflistung der für den FSP-Antrag benötig- 
ten Unterlagen auf der Informationsseite der Ärztekammer und der praktischen Handhabung 
vor, siehe dazu die Umfrageergebnisse in Kapitel 5. 
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Teilen und mehreren Abschnitten, die unterschiedliche Wertigkeit für die Ge- 
samtprüfung haben”: 


1. Verständnistest (früher Vokabeltest): Hier werden 20 medizinische 
Begriffe aus der Fachsprache ins Deutsche übersetzt und umge- 
kehrt sowie eine Schemazeichnung des Körpers mit medizinischen 
Bezeichnungen beschriftet bzw. ausgewählte Körperteile (in „Lai- 
ensprache“) unterschiedlich markiert. Für die Vorbereitung dieser 
Aufgaben wird die Arbeit mit medizinischen Wörterbüchern emp- 
fohlen. 

2. Freies Gespräch mit folgender Erläuterung: „Hier werden die Prüfer 
Ihnen Fragen stellen, um zu beurteilen, wie gut Sie Sprache verste- 
hen und wie gut Sie Antworten formulieren können“. 

3. Ein 20-minütiges Arzt*-Patienten*-Gespräch (Anamnesegespräch/ 


Patienten*aufklärung) in laienverständlicher Alltagssprache. Nicht 
eine vollständige Anamnese, sondern das Sprechen, Verstehen und 
Reagieren auf Patient*innen steht hierbei im Vordergrund und 
führt bei Nichtbeachten der Aussagen und Fragen dieser zu erheb- 
lichem Punkteverlust. 

4. Abfassen eines Schriftstücks (Kurz-Arztbrief): Hier soll eine ak- 
tuelle Anamnese in Form eines Fließtexts geschrieben und die er- 


fragten Informationen aus dem vorangegangen Anamnesegespräch 
stichwortartig erfasst werden. In Fachsprache folgen Ausführungen 
zu Verdachts- und Differenzialdiagnose(n) und zur zuvor mit der/ 
dem Patient*in mündlich besprochenen Untersuchungsforderung. 
Hierfür bekommen die Prüfungsteilnehmenden einen vierseiti- 
gen Anamnesebogen zum Ausfüllen, der auf der Internetseite zur 


10 Die Ausführungen beruhen auf den auf der Internetseite der Bezirksärztekammer veröffent- 
lichen Angaben (vgl. BAK 2020a). Trotz zusätzlicher , Ablaufhinweise zur FSP in Mainz‘ (vgl. 
BÄK 2020b) geben sie nicht umfassend Aufschluss über Details zu Prüfungsteilen, Bewer- 
tungskriterien und Prüfer*innen. Auf meine Anfrage bei der Kammer diesbezüglich wurde 
leider nicht reagiert. 
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Vorbereitung einsehbar und herunterladbar ist!!. Inkludiert ist das 
Ausfüllen von u.U. davon unabhängigen Anforderungsscheinen für 
weiterführende Untersuchungen. 

5. Aufgaben zum Lese- und Hörverstehen sowie ein Arzt*- Arzt*-Ge- 


spräch (was nach Hinzufügen des freien Gesprächs eigentlich Teil 
6 darstellen müsste”): Hier werden zu einem einseitigen Text (z.B. 
Befunde oder Arztbrief) drei Fragen auf einem Vordruck schriftlich 
beantwortet. Außerdem werden per Telefon (zwei Anrufe) patien- 
tenbezogene Informationen (z.B. aus dem Labor) übermittelt, die 
im Prüfungsbogen zu notieren sind. Bei dem Gespräch von Ärztin/ 
Arzt zu Ärztin/Arzt handelt es sich um ein Fachgespräch, bei dem 
in berufstypischer Sprache ein Bericht über die/den Patient*in aus 
Teil 1 oder die schriftlich bzw. akustisch übermittelten Informa- 
tionen aus Teil 4 oder sonstige medizinische Themen erfolgt. An 
dieser Stelle wird betont, dass es nicht um medizinisches Fachwissen 
und dessen Überprüfung geht, sondern um „die Fähigkeit, sich gut 
auszudrücken und sich fachsprachlich miteinander verständigen zu 
können“. Medizinische Fehler oder fehlendes medizinisches Wissen 
werden nicht bewertet. 


Die vorgestellten Prüfungsteile können hierbei in unterschiedlicher Abfolge 
geprüft werden (vgl. BÄK 2020a: 2). Dies übernehmen in der Regel zwei ap- 
probierte Ärzt*innen, die auch die Rolle der Gesprächspartner*in (Patient*in 
und Kolleg*in) einnehmen. Für das Bestehen muss jeder Prüfungsteil mit 
einer ihm zugeordneten Mindestpunktzahl abgeschlossen werden, wobei das 
Nichterreichen der erforderlichen Mindestpunkte in einem Teil zum sofor- 
tigen Abbruch der Prüfung führt. Die Prüfung gilt insgesamt als bestanden, 
wenn die Gesamtpunktzahl aus allen Prüfungsteilen bei über 60% liegt, d.h. 


11 Anamnesebogen verfügbar unter: https://aerztekammer-mainz.de/pdf/diverse/FSP-Anam- 
nesebogen-2020.pdf, 11.08.2020. 


12 Letzte Änderungen des Prüfungsablaufs bzw. der -teile erfolgten im Juni/Juli 2020. Zuvor: 1. 
Vokabeltest (ohne Körperschema), 2. Arzt*-Patienten*-Gespräch, 3. Verfassen eines Schrift- 
stücks (Kurz-Arztbrief), 4. Lese- und Hör-Verstehen, 5. Arzt*-Arzt*-Gespräch. Gründe für 
die Ergänzungen sind nicht bekannt. 
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eine Addition der Mindestpunktzahlen aus allen Priifungsteilen ist nicht 
ausreichend und muss durch höhere Punktzahlen in anderen Teilen ausge- 
glichen werden (vgl. ebd.). Das Prüfungsergebnis wird direkt im Anschluss 
an die Prüfung (mündlich) bekannt gegeben und bei bestandener Prüfung 
eine Bescheinigung (im Original) ausgestellt. Im Falle des Nichtbestehens 
kann die Prüfung wiederholt werden. Die Kosten für die Prüfung liegen 
derzeit bei 425€ (vgl. ebd.: 1). 

Dies stellen die offiziellen und zugänglichen Angaben der FSP in RLP dar, 
über deren tatsächlichen Ablauf die TN einen spezifischeren Aufschluss geben 
können, weshalb in einer Studie genau diese Erfahrungen abgebildet werden 
sollten. Aufgrund der oft fehlenden Transparenz seitens der Ärztekammern 
ist das Ziel der Umfrage u.a. Einschätzungen zu den Prüfungsinhalten sowie 
dem -aufbau, dem Prüfer*innenverhalten und der Bewertung zu erhalten. Fer- 
ner liefern die Aussagen der TN Anhaltspunkte für einen sich etablierenden 
Prüfungstourismus (vgl. Malakhova & Lenz 2018: 1), wonach die Wahl des 
Bundeslandes zum Ablegen der Prüfung nach dem vermeintlichen Schwie- 
rigkeitsgrad der FSP gewählt wird. 


4 Pilotstudie 


In Form einer quantitativen Online-Umfrage soll die ‚Innenperspektive‘ der 
Prüfung ermittelt werden und die Erfahrungen der Prüfungsteilnehmenden 
mit der von ihnen abgelegten FSP aufgezeigt werden. Die Zielgruppe der Um- 
frage waren demnach internationale Ärzt*innen, die bundesweit bereits an 
einer FSP teilgenommen haben, das Ergebnis dieser Prüfung spielte hierfür 
keine Rolle. Die Beantwortung des digitalen Fragebogens erfolgte seitens der 
Umfrageteilnehmenden (TN) selbstständig und anonym. 

Der Online-Fragebogen wurde mithilfe des Programms LimeSurvey erstellt 
und beinhaltet insgesamt 34 Fragen in verschiedenen Frageformaten wie Ein- 
fach-/Mehrfachauswahl von Antwortoptionen, Matrix- Auswahl, fünfstufige 
Likert-Skala sowie freie Texteingabe. Durch die Ergänzung nichtstandardisier- 
ter Fragen ist es trotz der meist vorgegebenen Antworten möglich, individuelle 
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Aspekte bzgl. bestimmter Sachverhalte zu ermitteln”. Die Fragen wurden in 
sechs Themenbereiche unterteilt: Allgemeines zur Person und zur Prüfung, zu 
den Prüfungsinhalten sowie dem -aufbau, zur Vorbereitung und Sonstiges. Alle 
Fragen wurden mit ‚Pflichtangabe‘ eingestellt. Durch die Rubrik ‚Sonstiges‘ 
wurde die Möglichkeit einer freien Antwort gegeben, sodass die Beantwortung 
der Fragen in jedem Fall gewährleistet werden konnte. Außerdem wurde bei 
den Einstellungen darauf geachtet, dass die TN innerhalb der Umfrage nicht 
zu den vorherigen Fragen zurückkehren können, um u.U. bereits abgegebene 
Antworten zu revidieren. 

Der Online-Fragebogen bzw. dessen Verlinkung wurde v.a. über die So- 
cial Media Plattform Facebook gezielt in fachspezifische Gruppen in Umlauf 
gebracht. Zudem wurde bei einem Kursträger für vom BAMF-geförderte ‚Me- 
diziner-Kurse‘ sowie einigen Beratungs- und Trainingsdiensten um die Wei- 
terleitung an die Prüfungsteilnehmenden gebeten. Es handelte sich somit um 
eine Teilerhebung, die auf einer willkürlichen Stichprobenauswahl basiert. Von 
einer ‚zufälligen Auswahl‘ im methodischen Sinne kann insofern gesprochen 
werden, da keine persönliche Beeinflussung seitens der Umfrage-Durchfüh- 
renden darauf erfolgte, wer aus der gewählten Zielgruppe letztlich an der Be- 
fragung teilnahm (vgl. Burzan 2015: 130). 

Einige ausländische Ärzt*innen nahmen dies zum Anlass eines direkten 
Austausches (per Mail) und berichteten über ihre individuelle Situation oder 
baten um Unterstützung in Bezug auf die FSP. Dies ermöglichte weitere Ein- 
blicke zu gewinnen. 


4.1 Umfrageergebnisse 


Die Online-Umfrage war bis zur Auswertung für drei Wochen aktiv'*. Die 
hier präsentierten Umfrageergebnisse beziehen sich auf diesen Zeitraum. Zu- 
nächst wird die Stichprobe der teilgenommenen Ärzt*innen kurz beschrieben 


13 Für Ausführungen zur Fragebogenkonstruktion vgl. bspw. Schnell et. al. (2018): Methoden 
der empirischen Sozialforschung, Berlin/Bosten: de Gruyter: 312ff. 


14 Die Umfrage ist aufgrund des hohen Interesses und zwecks Validierung weiterhin online zu- 
gänglich unter: https://survey.zdv.uni-mainz.de/index.php/395797?lang=de (Stand Oktober 
2020). 


162 © Frank & Timme Verlag für wissenschaftliche Literatur 


Evaluation der medizinischen Fachsprachenprüfung 


und anschließend die konkreten Ergebnisse der Umfrage dargestellt. Die Aus- 
wertung der durchgefiihrten Umfrage erfolgt anhand der zusammengestellten 
Antworten des Programms LimeSurvey. Statistiken und Interpretationen sind 
selbst erstellt". 


Allgemeines zur Person und zur Priifung 

Im besagten Zeitraum von drei Wochen haben insgesamt 149 Personen an der 
Umfrage teilgenommen, wovon 59 Teilnehmende den Fragebogen vollständig 
ausgefüllt haben. Ein möglicher Grund mag der Umfang von 34 Items sein, 
ein spezifisches ‚Abbruchmuster‘ ist nicht erkennbar. Für die Analyse wurden 
66 Fragebögen verwendet, da bei den sieben unvollständigen die letzten nicht 
beantworteten Fragen für diese Auswertung vernachlässigt werden können. 
Die TN-Gruppe bestand überwiegend aus Nicht-EU-Staatsbürger*innen, die 
v.a. in Syrien, Ägypten (je 9 TN), im Irak (7 TN) und in der Ukraine (4 TN) ihre 
medizinische Ausbildung absolvierten. Dies spiegelt die Angaben des BAMF 
wider (vgl. Kapitel 1). 

62 der 66 TN legten die FSP bei der jeweiligen Arztekammer ab. Die Mehr- 
heit absolvierte diese in Rheinland-Pfalz (RLP) (47), neben Baden-Wiirttem- 
berg, Bayern, Berlin, Brandenburg, Niedersachsen, Nordrhein-Westfalen, 
Sachsen und Thüringen. Dies ermöglicht, die Ergebnisse spezifischer für 
die Prüfung in RLP zu analysieren. Bei der Anerkennung zeigt sich Berlin 
besonders flexibel; dort wurden auch Prüfungen z.B. von telc und der PKT 
(Patientenkommunikationstest) anerkannt, obwohl es dort auch die ärztekam- 
merliche FSP abzulegen gilt. Insgesamt haben etwa 70% der TN die Prüfung 
bestanden, 10 TN gaben zusätzlich an, nicht (gleich) bestanden zu haben, 
wobei sogar drei bis vier Versuche erfolglos waren. Die Bestehensquote in 
RLP unter den Befragten lag auch bei 70%, wobei als häufigste Gründe für 
das Nicht-Bestehen das Prüfungsformat und die Struktur (z.B. Markierungen 
der Körperteile und Vokabeltest) sowie die prüfende Kommission genannt 


15 Die Auswertung mehrerer Variablen bzw. Ergebnisse unterschiedlicher Fragen der Umfrage 
wurden in Korrelation zueinander gesetzt und mithilfe von Excel (grafisch) dargestellt. Auf 
eine genaue Ausführung der durchgeführten Analysetechnik wird im Rahmen dieses Beitrags 
verzichtet. 
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wurden. Unter denjenigen, die bewusst RLP als Prüfungsort gewählt hatten, 
ist immer wieder von einer kürzeren Wartezeit bei der Terminvergabe bzw. 
einem schnelleren Vorgehen insgesamt von der Anmeldung bis zum Ablegen 
der Prüfung die Rede. Nur ein/e TN gab an, dass sie/er die Prüfung anstatt in 
Mainz lieber in Rostock hätte ablegen wollen, da diese angeblich „viel einfa- 
cher“ sei und „weniger Fachbegriffe“ (ID 98, F7)!° abgefragt würden. 

Von den 47 TN, die die FSP bestanden haben, sind 27 TN in Besitz einer 
Approbation und haben in Deutschland eine Arbeitsstelle. Die niedrige Zahl 
lässt sich sicherlich mit den langen Wartezeiten auf die bei Nicht-EU-Bür- 
ger*innen erforderliche Kenntnisprüfung erklären (vgl. Kapitel 1.1). Sieben 
FSP- Absolvent*innen sind auch ohne Approbation bereits als Ärztin/Arzt tätig 
(in Berlin, RLP, Bayern, Thüringen), was im Rahmen einer Berufserlaubnis 
möglich ist (vgl. Kapitel 1.1). In Bezug auf den Arbeitsort konnte festgestellt 
werden, dass über 70% der TN, die in RLP die FSP abgelegt haben und als 
Ärzt*innen tätig sind, in einem anderen Bundesland arbeiten und als ein An- 
zeichen für den vermeintlichen Prüfungstourismus gedeutet werden kann. 
Sonst entspricht der Arbeitsort auch dem Bundesland der abgelegten Prüfung. 

Den Prüfungsablauf empfanden insgesamt rund 65% als transparent (RLP: 
63%), wobei mehr als ein Viertel (RLP: 34%) angab, dass die Prüfung nicht oder 
nur teilweise wie erwartet durchgeführt wurde. Der Umfang wurde bei deram 
häufigsten durchgeführten ‚3-Teile-Prüfung‘ (vgl. Kapitel 3) mehrheitlich mit 
„genau angemessen“ eingestuft, der Schwierigkeitsgrad allerdings von mehr 
als der Hälfte als „schwer“ oder sogar „zu schwer“. 

Zu den Prüfer*innen machten die TN folgende Angaben: Die Prüfenden 
schnitten in den Kategorien „gut vorbereitet“ und „fachlich kompetent“ am 
besten ab, wohingegen sie nicht als besonders „fair“ und „motiviert“ sowie 
noch weniger als „geduldig“ galten. Hierbei decken sich die allgemeinen 
Einschätzungen mit denen in RLP. Trotz des ausdrücklichen Verweises im 
GMK-Beschluss (87. GMK 2014: 6) als auch im Informationsblatt der Be- 


16 Dies stellt die Zuordnung der Umfrageergebnisse dar. ID 98: Teilnehmendennummer, ano- 
nymisiert; F7: „Frage 7°, Bezifferung der Fragen nach Erstellung im Programm LimeSurvey. 
Die Reihenfolge des Erstellens und die Nummerierung sind fiir die Auswertung nicht von 
Bedeutung. 


164 © Frank & Timme Verlag für wissenschaftliche Literatur 


Evaluation der medizinischen Fachsprachenprüfung 


zirksärztekammer Rheinhessen für die Prüfung in RLP, dass das Fachwissen 
der Ärzt*innen weder getestet noch bewertet wird, wurde bei 65% der TN 
(RLP: knapp 60%) auch medizinisches Fachwissen abgefragt. Wenn man be- 
denkt, dass es sich um eine Sprachprüfung handelt und nicht alle TN eine 
Facharztausbildung absolviert haben (29% der Befragten), führt dies unwei- 
gerlich zur Benachteiligung und u.U. sogar zur ‚Verfälschung‘ der Bewertung. 
Ein/e TN schreibt hierzu: „Es war nicht klar, wie ich genau antworten sollte 
entweder ist es über medizinische Kenntnisse orientiert oder Kommunikation 
und Sprachfähigkeit“ (ID 79, F10). 

Durchgängig werden bei mehreren Fragen im Hinblick auf den Prüfungs- 
ablauf, die Bewertung(skriterien) und die allgemeine Zufriedenheit immer die 
Prüfer*innen bzw. die Prüfungskommission und deren Verhalten erwähnt, was 
u.a. als „subjektiv“, „unfair“ „unangenehm“ und sogar „rassistisch“ beschrieben 
wird sowie das Bestehen stark von ihnen abhängen würde. Trotzdem werden 
im Allgemeinen die Bewertungskriterien von 65-71% der TN als „fair“, „trans- 
parent“ und „angemessen“ gesehen, in RLP fällt diese Beurteilung schlechter 
aus: „fair“ und „transparent“ finden diese um die 60%, „angemessen“ jedoch 
nur 27%. Ein/e Befragte/r äußert sich zu diesem Thema wie folgt: 


Ich habe mich für diese Prüfung vollständig vorbereitet. Alle Details aus 
verschiedenen Büchern habe ich gelernt. Auf der anderen Seite war das 
Niveau der Prüfung echt niedrig. Ich kann mir gut vorstellen, dass vie- 
le ausländische Kollegen besonders aus Drittstaat die Prüfung bestehen 
können, ohne notwendige Fertigkeiten zur Arbeit als Arzt in Deutschland 
zu haben. Das ist echt schlecht. Höhe bestandenquete in dieser Prüfung 
ist peinlich für Deutschlanda Gesundheitswesen sowie Kliniken, die diese 
Kollegen mit nicht genug Deutschkenntnissen einstellen werden [sic] (ID 
120, F11).” 


Des Weiteren bestätigten die Befragten, dass in den meisten durchgeführten 
FSP eine/einer der prüfenden Ärztinnen/Ärzte auch die Rolle der/des Ge- 


17 Die Aussagen der Umfrage-Teilnehmenden wurden im Original übernommen und bewusst 
nicht korrigiert. 
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sprächspartner*in beim Anamnese-Gespräch und bei der Patienten*vorstel- 
lung einnahm. Dies wird unterschiedlich kommentiert, zum einen nehmen 
TN an, Ärzt*innen könnten besser Symptome erklären und die „Arbeit“ besser 
beurteilen, zur FSP in RLP heißt es jedoch bspw. auch: 


Die Prüfung in Mainz ist sehr subjektiv. [xy]'® war der Prüfer und meint, 
dass meine Aussprache zum [Miss] Verständnis führe. Dann habe ich 
B2.C1 telch FSP abgelegt und bestanden. Meiner Meinung nach müssen 
bei einer FSP ein Arzt/in und ein Germanist/in als prüfer sein [sic]. (ID 
67, F6) 


Die große Mehrheit der TN absolvierte eine FSP mit den üblichen drei Teilen, 
wie im GMK-Beschluss beschrieben, bei denen ein einziger Patienten*-Fall 
behandelt wurde. Erstaunlicherweise gaben 11 TN an, in RLP bei der FSP nicht 
mit einem ‚Ein-Fall-Szenario‘ gearbeitet zu haben. Dies widerspricht jedoch 
jeglichen Informationen seitens der Ärztekammer, Kolleg*innen und weiteren 
Prüfungsteilnehmenden. Die Frage, ob unterschiedliche Patienten*-Fälle für 
die einzelnen Teile bevorzugt würden, wurde klar mit „Nein“ (85%) beant- 
wortet. 


Prüfungsinhalte und -aufbau 
Es wurde nach dem zur Verfügung stehenden Zeitrahmen gefragt. Die je 20 
Minuten pro Teil wurden von fast allen als entweder „genau richtig“ (50%) 
oder sogar „zu kurz“ (44%) eingeschätzt. Die im Berufsalltag knapp abrufbare 
Zeit würde diese TN sicherlich vor große Herausforderungen und zeitliche 
Hürden stellen. 

Die Prüfungsinhalte wurden insgesamt von mehr als 60% als „sehr rele- 
vant“ oder „relevant“ und von knapp 40% als „teilweise relevant“ oder „nicht 
relevant“ für den Berufsalltag eingestuft. Die Verteilung verhält sich ähnlich in 


18 Ein Arzt der Prüfungskommission in Mainz wird mehrmals von verschiedenen Befragten 
namentlich genannt und scheint unter den Prüfungsteilnehmenden bekannt und ‚berüchtigt‘ 
für seine ‚Strenge‘ zu sein. Diese wird seitens einer Kollegin, die ihn bereits bei einer Hospi- 
tation bei der FSP erlebte, eher als ‚genau‘ bezeichnet, der v.a. auch sprachliche Nuancen wie 
Humor und Ironie mitbewertet. 
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RLP, wobei hier hauptsächlich die enorme Anzahl an medizinischen Wörtern, 
die sowohl in Fach- als auch in Laiensprache für den Vokabeltest (auswendig) 
gelernt werden, für irrelevant angesehen wird. Zudem wünschen sich einige 
TN spezifischere Themen/Fälle, die die Fachrichtung der Kandidat*innen be- 
rücksichtigen. 

In diesem Zusammenhang wurden die TN außerdem gefragt, was sie 
außerhalb der fachlichen Kommunikationsebenen als prüfungsrelevant hiel- 
ten. Dabei wählten die TN vorwiegend „ein Aufklärungsgespräch vor einer 
Operation“ und „den Austausch mit dem Pflegepersonal“. Außerdem wurde 
mehrfach die Aufklärung von weiterführenden Untersuchungen (z.B. MRT, 
CT) genannt, was das Training und Überprüfen der ‚Patienten*aufklärung‘ 
bekräftigt. Ein/e Befragte/r bemängelte, dass in der FSP nicht genügend Kom- 
munikationsfähigkeiten geprüft würden. Im Hinblick auf die Prüfungsform 
würden sich dennoch nur 11 der TN für eine um die genannten Kommunika- 
tionssituationen erweiterte Variante entscheiden. Diejenigen, die sich für die 
übliche Form mit drei Teilen bzw. Kommunikationssituationen aussprachen, 
nannten dafür bspw. den damit verbundenen erhöhten Lernaufwand und 
Stress, dass diese Teile das Minimum an ärztlichen Kenntnissen darstelle und 
diese zur Sprachbeurteilung ausreichen würden. Außerdem wäre bei weniger 
Teilen eine Vertiefung möglich und bei mehreren kürzeren bestünde das Risiko 
für Redundanz. Ein/e TN ergänzte: 


Aufklärungen dürfen wir im Alltag mit ein Aufklärungsbogen durch- 
führen, muss nicht auswendig gemacht werden, deswegen sehe ich kein 
Grund dass das ein Teil von der Prüfung sein soll [sic]. (ID 106, F23) 


Diese Rückmeldungen spiegeln eine verbreitete Orientierung des reinen ‚Prü- 
fungs-Bestehens‘ wider statt einer notwendigen ,Kompetenzorientierung, be- 
sonders hinsichtlich der Relevanz für das Berufsleben. Für 30% der TN ist die 
Prüfungsform oder die Anzahl der Teile unwichtig, solange es eine gerechte 
und faire Prüfung ist, die letztlich bewertet, wie gut man vorbereitet ist bzw. wie 
gut man Deutsch sprechen und schreiben kann. Ein/e TN erwähnt in diesem 
Zusammenhang die Problematik des Auswendiglernens: 
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[...] Der Inhalt der Priifung muss unerwartet sein, sodass Kolleginnen 
und Kollegen nicht bestimmte Sätze lernen können [sic]. (ID 120, F24) 


Bislang finden die FSP in Präsenz statt. Bei der Umfrage wurden die TN zur 
ihrer Meinung über eine digitale Version der FSP befragt. 28 TN sprachen 
sich dafür und 32 eher dagegen aus. Bei einem digitalen Angebot wählten 
etwas weniger „bereits im Heimatland“ statt „in Deutschland“. Als häufigste 
Begründung, eine digitale Prüfung in der Heimat ablegen zu wollen, wurde 
die Zeit- und Kostenersparnis genannt. Weniger Stress und Nervosität werden 
diesem Format auch zugeschrieben. Allerdings drückt diesbezüglich ein/e Be- 
fragte/r folgende Bedenken aus: 


Online Prüfungen kommen mit großer Gefahr von einem Betrug. Leider 
Manche Menschen sind werden mit gefälschten Unterlagen in Deutsch- 
land als Arzt anerkannt. Ich habe viele gesehen ohne ärztliche Kenntnisse 
besonders aus arabischem Raum. Sie können keine EKG oder Laborbe- 
funde interpretieren. Selbstverständlich, dass deutsche Patienten in be- 
sonderer Gefahr stehen werden [sic]. (ID 120, F31) 


Vorbereitung 

Insgesamt wird die Prüfungslandschaft bzw. das Anerkennungsverfahren von 
mehr als 70% als „(sehr) unübersichtlich und komplex“ bewertet. Als Informa- 
tions- und Beratungsquellen dienen den TN hauptsächlich das Internet sowie 
Freunde und Bekannte mit FSP-Erfahrung, Beratungsstellen in Deutschland 
wurden auch vermehrt genutzt. 

Der Großteil der Befragten (ca. 65%) gab an, sich im Selbststudium sprach- 
lich auf die FSP vorbereitet zu haben, gefolgt von privaten Sprachkursen zur 
Prüfungsvorbereitung (ca. 38%) und Online-Training (ca. 32%). Lediglich 11 
TN nahmen an den BAMF-geförderten Kursen „Spezialmodul Heilberufe“ 
teil. Neben einer Vorbereitung auf das Prüfungsformat gilt ein allgemeines 
Sprachniveau auf B2-Niveau durch die 87. GMK als vorgeschrieben und ist 
normalerweise bei der Beantragung zur Approbation bzw. zur Anmeldung der 
FSP vorzulegen. Die meisten der Befragten waren in Besitz eines anerkannten 
B2-Zertifikats, 13 TN gaben an, dass sie über ihre B2-Kenntnisse lediglich 
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einen Nachweis einer Sprachschule hatten. Und zwei Personen, die die FSP 
in RLP ablegten, konnten sogar kein B2-Niveau nachweisen. Wie in Kapitel 3 
erwahnt, ist laut des Informationsblatts der Arztekammer in RLP dem Antrag 
zur FSP eine Kopie eines Sprachzertifikats beizufügen, wobei eine Nennung 
des Sprachniveaus fehlt (vgl. BÄK Rheinhessen 2020: 1) und die FSP letztlich 
auch ohne Einreichen eines Sprachzertifikats abgelegt werden kann. 


Sonstiges 

Die vielen sehr fehlerhaften ‚freien Kommentare‘ seitens der TN bekräftigen 
den Eindruck mangelhafter Sprachkenntnisse und veranschaulichen eine deut- 
liche Diskrepanz: ‚Sprachliche Defizite‘ gelten laut TN einerseits oft als Grund 
für das Nichtbestehen der FSP seitens der Prüfungskommission, andererseits 
werden TN ohne einen B2-Nachweis offensichtlich zur FSP zugelassen bzw. 
bestehen diese sogar ohne allgemeine Sprachkenntnisse auf B2-Niveau. Nach 
Aussagen eines TN ist dies auch der Grund, warum die FSP in RLP als „einfa- 
chere“ gewählt würde. Er habe die FSP beim zweiten Mal trotz nicht vorhan- 
dener B2-Sprachkenntnisse und ohne Nachweis allgemeiner Sprachkenntnisse 
bestanden. Dass es sein Zweitversuch war, habe ihm sicherlich dabei geholfen. 
Das Zulassen ohne erforderliches B2-Zertifiakt und folglich erhöhter Durch- 
fallquote wirft die Frage nach einer wirtschaftlich motivierten Durchführung 
der FSP auf. Dazu berichtet ein/e TN passend: 


Ich hab von Anfang wusste, dass ich die Prüfung nicht bestehe. Der Se- 
kretär wurde von jemandem gefragt, wie viel Leute haben wir heute und 
wie viel von ihnen sind im ersten Versuch. Leider war ich der einzige im 
ersten Versuch (und hab nicht bestanden). Ich glaube es geht nur um Geld 
und gibt keine logische Grund dafür jemand durchfallen zu lassen. Ich 
rede in meinem Fall [sic]. (ID 54, F10) 


Und fügt später hinzu: 


Die Skruktur der Prüfung muss sich ändern. Es geht um einer Arbeit im 
Krankenhaus. Und dort wird du mehrmals etwas kontrollieren bevor sie 
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antreten oder machen. Deswegen die Form der Priifungen heutzutage 
richtet sich nur nach Finanzielle Profis und nichts mehr [sic]. (ID 54, F31) 


Als weitere (Anderungs)Vorschlage fiir die Priifung und zur Verbesserung 
der Sprachkenntnisse können u.a. folgende Äußerungen seitens der Befragten 
genannt werden: 


Manche Kollegen lernen nur bestimmte Fälle und memorisieren bestimm- 
te Sätze, um die Prüfung bestehen zu können. Der Inhalt der Prüfung 
muss variant und vielfältiger sein, sodass inkompetente Kollegen sich 
mehr für lernen engagieren [sic]. (ID 120, F22) 


Ich denke, es wäre besser, wenn die Ärztekammer und die Krankenhäuser 
kooperieren, damit die Ärzte eine Hospitation vor der Prüfung und Arbeit 
könnten. Meiner Meinung nach wäre das sehr hilfreich, die Sprche der 
Ärzte/innen zu verbessern [sic]. (ID 41, F31) 


Die vorgestellten Ergebnisse geben nur einen sehr skizzenhaften Einblick darü- 
ber, wie die zukünftigen Ärzt*innen die FSP empfinden, aber gerade die freien 
Kommentare sind schon sehr aufschlussreich und bekräftigen, das Prüfungs- 
format noch weiter zu untersuchen. 


5 Fazit und Ausblick 


Im Rahmen dieser Umfrage wurden die relevantesten Ergebnisse und somit 
eine erste Evaluation der FSP seitens der TN präsentiert, was v.a. eine ‚Innen- 
ansicht‘ der vorgestellten FSP in RLP ermöglichte. Das Ziel der Repräsentati- 
vität und der Möglichkeit einer Quantifizierung der (Umfrage- und Analyse-) 
Ergebnisse auf die Gesamtheit der Prüfungen kann mithilfe dieser Erhebung 
nicht zufriedenstellend realisiert werden. Die Ergebnisse ermöglichen jedoch 
einen Einblick auf die aktuelle Prüfungssituation sowie in die Erfahrungswelt 
der Prüfungsteilnehmenden und lassen einen Rückschluss auf die Anforde- 
rungen der FSP als Nachweis medizinischer Fachsprachenkompetenzen zu. 
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Das vorgestellte Priifungsformat stellt, nach Vorgaben des GMK-Beschlus- 
ses, eine Fachsprachenpriifung dar, die medizinspezifische Sprachkenntnisse 
(auf C1-Niveau) überprüft. Hinreichend valide scheint die FSP jedoch nicht zu 
sein, da die Umfrage ein vermehrtes Uberpriifen medizinischen Fachwissens 
ergab und laut einigen TN nicht ausreichende Kommunikationsfahigkeiten 
und fiir den Beruf unzureichende Deutschkenntnisse gepriift wiirden. Die 
Frage ‚Was genau gemessen werden soll?“ sollte also hinsichtlich der in Kapi- 
tel 2 dargelegten Kommunikationskompetenzen zur Ausübung des ärztlichen 
Berufs erneut gestellt werden bzw. diese auch transparenter gemacht werden. 

Darüber hinaus ist bereits die Zulassung zur FSP und sogar das Bestehen 
ohne (Zertifikats-) Nachweis allgemeiner Deutschkenntnisse auf B2-Niveau, 
was aus Sicht der TN eher als Vorteil empfunden wird, bedenklich. Berufe, bei 
denen die Patienten*sicherheit oberstes Gebot darstellt und die Gesundheit 
auf dem Spiel stehen kann, bergen durchaus beachtliche Risiken. Der Per- 
sonalmangel im medizinischen Bereich sollte und darf nie zu einem Herab- 
setzen der zur Berufsaustibung fachlichen wie sprachlichen Anforderungen 
führen, auch nicht zu Berufsbeginn. Die Einschätzung, dass die durch die FSP 
nachgewiesenen Sprachkenntnisse zu niedrig für das souveräne Bestreiten des 
Berufsalltags sind, teilen auch andere zugewanderte Mediziner*innen, wie in 
einer Studie von Borowski gezeigt wurde (vgl. 2018: 359). Außerdem sprach 
sich das deutsche!? Klinikpersonal bei einer Befragung durch Soppa mehr- 
fach für „ein besseres Sprachniveau [...] als Lösungsvorschlag [aus], um als 
ausländischer Arzt oder Ärztin an einer deutschen Klinik Fuß fassen zu kön- 
nen“ (2019: 55). Außerdem zeigte sich bei dieser Erhebung, dass „Patienten/ 
innen [...] sprachliche Fähigkeiten und Fachkompetenz eng miteinander zu 
verknüpfen [scheinen]. Wenn sie ihre Ärzte/innen nicht gut verstehen, fühlen 
sie [sich] nicht adäquat behandelt, was in Verunsicherung münden kann“ (ebd.: 
54), nicht zuletzt deswegen sind ein hochangesetztes Sprachniveau als auch 
‚strenge‘ Bewertungskriterien essenziell. 

Eine Einheitlichkeit der FSP in den Bundesländern bei Durchführung und 
Bewertung wäre hierfür sehr förderlich. Grundlegend ist darüber hinaus die 


19 Unter ‚deutsch‘ werden hier Personen bezeichnet, deren Muttersprache Deutsch ist sowie in 
Deutschland sozialisiert wurden. 
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Einstellung der internationalen Ärzt*innen, die sich nicht ausschließlich auf 
ihre fachlichen Kenntnisse und medizinischen Fähigkeiten verlassen dürfen, 
sondern der Sprache und ihrer kompetenten Verwendung (aufallgemein- und 
fachsprachlicher Ebene) höhere Wichtigkeit beimessen müssen. Dies ist letzt- 
lich auch für das Bestehen der FSP ausschlaggebend. 

Mögliche Zusammenhangshypothesen wie z.B. ein Bezug zwischen einer 
Bestehensquote und der Länge des Aufenthalts in Deutschland vor Ablegen der 
FSP, welche Rolle die Form des allgemeinen Deutscherwerbs als auch die Prü- 
fungsvorbereitung sowie das Herkunfts- bzw. Ausbildungsland spielt, müss- 
ten über diesen Beitrag hinaus untersucht werden. Außerdem wären weitere 
Erhebungen zu den durch die Rückmeldungen entstandenen Fragen auch im 
Vergleich zu anderen Bundesländern interessant und könnten vertiefende Ein- 
blicke verschaffen. Berlin bspw. ist in der Umfrage bei drei Punkten positiv auf- 
gefallen: einerseits die in Kapitel 4 beschriebene Flexibilität bei der Anerken- 
nung anderer Prüfungen, andererseits werden dort bei derärztekammerlichen 
FSP laut der TN bei der Anamnese und bei der Patienten*vorstellung vermehrt 
externe Personen als Gesprächspartner*in eingesetzt. Außerdem sind die Be- 
wertungskriterien für die drei Teile transparenter. Musterbewertungsbogen 
werden dafür online von der Ärztekammer bereitgestellt”. Von den wenigs- 
ten Ärztekammern, wie auch in RLP, werden das methodische Vorgehen also 
auch die Bewertungskriterien offengelegt. Die Objektivität der Bewertung wird 
zudem durch die Rollenübernahme der Gesprächspartner*innen seitens der 
prüfenden Ärzt*innen vermindert und es wird in der Umfrage vermehrt eine 
Abhängigkeit der Testergebnisse von den jeweiligen Prüfenden beschrieben. 

Der Transparenz allgemein und einer prüfungsorientierten Vorbereitung 
würden Hospitationsmöglichkeiten bei der FSP z.B. seitens der unterrichten- 
den KL zugutekommen. Ferner könnten mit einer Ausweitung des Kursange- 
bots v.a. der BAMF-geförderten Maßnahmen, um die durchaus hohen Kosten 
für Kurse, Prüfungen und Approbationsverfahren zu minimieren, mehr aus- 
ländische Ärzt*innen erreicht und damit das Training wichtiger Kommunika- 


20 Bewertungskriterien bzw. die Musterbewertungsbogen der Ärztekammer Berlin, abrufbar 
unter: https://www.aerztekammer-berlin.de/10arzt/61_Fachsprachpruefung/index.html, 
19.08.2020. 
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tionskompetenzen gefördert werden. Eine gezielte Vorbereitung erhöht auch 
die Chancen, die FSP bereits beim ersten Durchlauf zu bestehen. 

Bei der Umfrageerhebung konnte ein hohes Mitteilungsbedürfnis seitens 
der Prüfungsteilnehmenden festgestellt werden, was sicherlich Anlass für wei- 
tere Forschungen gibt. Der Fokus könnte dabei auf die Prüfer*innen, deren 
Schulung und Verhalten sowie auf die Bewertungskriterien gelegt werden, um 
somit auch die TN-Rückmeldungen besser beurteilen zu können. Ein Aus- 
tausch mit den prüfenden Ärzt*innen könnte hierbei Aufschluss über ‚die 
andere Seite‘ geben und eine Stellungnahme zu den oft sehr kritischen Äuße- 
rungen der TN gegenüber der Prüfungskommission ermöglichen. 

Ferner betont Roche in diesem Zusammenhang, dass „eine voreilige Diag- 
nose von sprachlichen Fertigkeiten ohne die wissenschaftliche Fundierung sol- 
cher Tests [...] verhängnisvoll werden [kann]“ (2013: 108). Der neue, von ihm 
an der LMU und dem Klinikum der Universität München 2018 mitentwickelte 
Sprachtest für ausländische Mediziner” (kurz SAM) setzt genau hier an und 
beruht für eine zuverlässige Bewertung fachspezifischer Sprachkompetenzen 
auf einem wissenschaftlich fundierten Konzept. Ob die Etablierung des SAM 
eine Lösung der dargestellten, durchaus problematischen Prüfungssituation 
sein kann, muss genauer betrachtet und vergleichend analysiert werden”. 
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Anhang: Anerkennungsverfahren (Deppe et al. 2015: 22f.) 


Der Regelfall... gilt nicht in jedem Einzelfall. 
B2-Zertifikat) 


45% 
(Zuwanderung 
2014) 
Nicht-EU- 
Abschluss 
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Fachsprachenpriifungen als Nachweis der 
Sprachkompetenzen?! - Ein Vergleich mit dem neu 
entwickelten Sprachtest für ausländische Mediziner (SAM) 


Einleitung! 


„Heilkunst braucht auch Sprachkunst“, sagte Dr. Theodor Windhorst, Präsi- 
dent der Ärztekammer Westfalen-Lippe 2019, anlässlich der 5.000. Fachspra- 
chenprüfung für ausländische Ärzt*innen (seit ihrer Einführung im Jahr 2014), 
die von der Kammer abgenommen wurde (vgl. AKWL 2019: 0.S.). Diese Aus- 
sage impliziert zum einen die notwendigen Sprachkompetenzen zur Ausübung 
eines Heilberufs allgemein; zum anderen stellt sich damit die Frage, welche 
Sprachkenntnisse dafür benötigt werden bzw. welche Anforderungen dies an 
eine Fachsprachenprüfung stellt, die diese Kompetenzen bei ausländischen 
Ärzt*innen zu überprüfen vermag. 

Fest steht, dass „[d]ie Sprache [...] eines der elementaren Werkzeuge für 
die ärztliche Tätigkeit [ist]“ (Borowski 2018: 17) und „[...] eine Schlüssel- 
funktion in der Arzt-Patienten-Beziehung“ (Windhorst, zit. in: ÄKWL 2019: 
0.8.) einnimmt. Fachspezifische Sprachkompetenzen sind nicht nur zur Aus- 
übung des Berufes unabdingbar, sondern in Deutschland auch gesetzlich vor- 
geschrieben. Gemäß den Beschlüssen der 87. Gesundheitsministerkonferenz 
2014 sind allgemeinsprachliche Zertifikate und Diplome zur Überprüfung der 
fachsprachlichen Deutschkenntnisse nicht ausreichend (vgl. 87.GMK 2014: 2). 
Fachsprachenprüfungen sollen dafür Abhilfe schaffen und stellen laut Wind- 


1 Indem Artikel „Die medizinische Fachsprachenprüfung - Eine Pilotstudie zur Evaluation 
durch die Teilnehmenden“ (in diesem Band) wurden Desiderata bei der Fachsprachenführung 
thematisiert. Dort wurde der neu entwickelte Sprachtest für ausländische Mediziner (kurz 
SAM) bereits angesprochen, der hier in den Fokus rückt; dabei kommt es zuweilen zu Dop- 
pelungen, die jedoch notwendig sind, um die Artikel auch separat verstehen zu können. 
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horst einen ,,Garant fiir Patientensicherheit, medizinische Versorgungsqualitat 
und Integration“ (zit. in: ÄKWL 2019: 0.S.) dar - ein einheitliches Prüfungs- 
und Anerkennungsverfahren existiert jedoch bislang nicht, trotz Bestrebungen 
der GMK einer bundeseinheitlichen Vorgehensweise (vgl. 87.GMK 2014: 7). 

Der von der LMU bzw. dem Klinikum der Universität München 2018 neu 
entwickelte Sprachtest für ausländische Mediziner? (kurz SAM) setzt genau hier 
an und gilt seitens der Testautor*innen als „erste[r] und bis dato einzige[r] 
bundesweite[...] Ansatz einer wissenschaftlich fundierten Fachsprachenprü- 
fung“ (Lenz et al. 2019: 0.S.). 

Ziel dieses Artikels ist die Vorstellung des SAM und diesen vergleichend 
zu etablierten Priifungsformaten zu betrachten, um den Ansatz und die An- 
forderung einer validen Prüfung der von ausländischen Mediziner*innen ge- 
forderten Fachsprachenkompetenzen zu evaluieren. Dabei wird analysiert, ob 
der neue SAM den Anforderungen gerecht wird und somit eine Möglichkeit 
zur bundesweiten FSP darstellen kann. 

Dafür wird zunächst ein theoretischer Überblick zu den formalen und 
inhaltlichen Prüfungsanforderungen sowie deren Herausforderungen gege- 
ben. Dieser dient als Grundlage für die in Kapitel zwei anknüpfenden Analyse 
und Evaluation der im Bereich Medizin etablierten Prüfungsformate bzw. des 
SAM. Hierfür werden neben dem SAM exemplarisch die Fachsprachenprü- 
fung Medizin von telc und die FSP des Landes Rheinland-Pfalz dargestellt. 
Abschließend folgt im dritten Kapitel eine Diskussion über die Notwendigkeit 
und Sinnhaftigkeit, ein neues, einheitliches Prüfungsformat zu etablieren. 


1 Formale und inhaltliche Anforderungen 
an Fachsprachenpriifungen 


Fachsprachenprüfungen (FSP) lassen sich der Form „fremdevaluative Tests“ 
(Handt 2002: 187) zuordnen, da ihre Entwicklung, Durchführung und Aus- 
wertung durch externe Expert*innen erfolgt (vgl. ebd.). In der Erwachsenen- 
bildung erfüllen Tests unterschiedliche Funktionen und werden demnach 
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grundlegend nach Einstufungstest, Diagnostiktest, Lernfortschrittstest und 
Sprachstandstest unterschieden (vgl. ebd.). Unter Sprachstandstests sind meist 
standardisierte Sprachzertifikate zu verstehen, die nach einem Sprachbeschrei- 
bungsmodell, zunehmend dem GER, den Leistungsstand einer Zweit- oder 
Fremdsprache zum Zeitpunkt der Prüfung schriftlich und mündlich messen 
(vgl. ebd.). Der Lernprozess oder -fortschritt wird hierbei nicht festgehalten 
(vgl. Perlmann-Balme 2016: 420). 

Im Bereich Medizin verbessert das Ablegen einer FSP nicht nur die Chan- 
cen auf eine Arbeitsstelle, sondern ist mittlerweile gesetzlich verpflichtend, 
wobei sie dennoch auf eigene Kosten erworben werden muss (vgl. ebd.). Als 
Ziel der Testsituation wird u.a. beschrieben, „[...] möglichst authentische 
fremdsprachliche Leistungen der Teilnehmenden herauszufordern“ (Rossa 
2016: 400) und zwar unter für alle TN möglichst fairen und vergleichbaren 
Bedingungen (vgl. ebd.). 

Darüber hinaus erheben Sprachtests, wie jede wissenschaftliche Messung, 
den Anspruch „möglichst objektiv, zuverlässig und gültig“ zu sein (Diekmann 
2009: 247). Die drei daraus entstehenden Gütekriterien Objektivität, Reliabi- 
lität und Validität spielen gerade bei Sprachstandtests und standardisierten 
Sprachzertifikaten eine sehr große Rolle (vgl. Handt 2002: 189). Ein valider 
Test sollte genau das messen, was tatsächlich gefragt ist, z.B. bestimmte Kom- 
petenzen (vgl. ebd.). Ob eine Messung bzw. deren Ergebnisse reliabel, also zu- 
verlässig und genau sind, kann durch ein hohes „Maß an Reproduzierbarkeit“ 
(Diekmann 2009: 250) gewährleistet werden. Das Erfüllen des dritten Gütekri- 
teriums, die Objektivität, steht eng im Zusammenhang mit Transparenz. Diese 
wird durch die Offenlegung des methodischen Vorgehens und Darlegung der 
zu berücksichtigenden Faktoren gewährleistet (vgl. Schmelter 2014: 35f) und 
stellt die Unabhängigkeit der Testergebnisse von den jeweiligen Bewertenden/ 
Prüfenden dar (vgl. Handt 2002: 189f.). Detaillierte Bewertungskriterien und 
intensives Prüfer*innentraining? unterstützen die Minimierung des individu- 
ellen Bewertungsspielraums (vgl. ebd.). 

Ein verstärktes Qualitätsbewusstsein entstand in den 1990er Jahren und 
zog eine Zunahme an Selbstkontrollen der Sprachtestanbieter mit sich (vgl. 
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Perlmann-Balme 2016: 422). Die Vereinigung von Sprachprüfungsanbietern in 
Europa (Association of Language Testers in Europe - ALTE) entwickelte hierfür 
17 Mindeststandards‘ sowie im Auftrag des Europarats ein Handbuch zur Ent- 
wicklung und Durchführung von Sprachtests unter der Verwendung des GER 
(vgl. ALTE 2012). Der Umsetzung und Einhaltung dieser Qualitätsstandards 
haben sich ihre Partner*innen und Mitglieder, vornehmlich international ver- 
breitete Anbieter, verpflichtet. Im Bereich Deutsch als Fremdsprache zählen 
dazu das Goethe-Institut, die tele gGmbH und das TestDaF Institut. Als Phasen 
einer standarisierten Prüfung gelten bei ALTE: Planung, Testentwicklung, Pi- 
lotierung und Informationen von Beteiligten (vgl. ALTE 2012: 79), bspw. auch 
als Planungsphase, Designphase, Erprobungsphase und Finalisierungsphase 
(vgl. Shafer & Wiedenkeller 2012: 119ff.) bezeichnet. 

Die Bewertung der FSP bzw. die Vergabe dieses Sprachzertifikats ist für die 
prüfungsteilnehmenden Ärzt*innen von existentieller Bedeutung, was umso 
mehr für eine standardisierte und bundesweit einheitliche FSP spricht. Gleich- 
zeitig tragen die Testentwickler*innen damit eine hohe Verantwortung, die 
nachzuweisenden Kompetenzen glaubwürdig zu überprüfen und zu dokumen- 
tierten, was wiederum an einen hohen Anspruch der Erfüllung der Gütekrite- 
rien gekoppelt ist (vgl. Perlmann-Balme 2016: 422). Über diese fachspezifische 
Sprachkompetenzen gilt es, einen Nachweis zu erbringen, deren Komplexität 
im folgenden Abschnitt kurz skizziert wird. 


1.1 Sprachkompetenzen 


Medizinische Kommunikation ist durch eine große Vielfalt an Kommunika- 
tionsebenen, -formen und -situationen gekennzeichnet, an denen eine Viel- 
zahl an Gesprächspartner*innen beteiligt sind (vgl. Roelcke 2005: 193)°. Zur 
Bewertung und Überprüfung von Sprachkompetenzen werden meist die Ni- 
veaubeschreibungen des GER für die Fertigkeiten Hören, Lesen, Schreiben 


4 17 Mindeststandards zur Sicherstellung von Qualität in den Prüfungen der ALTE, abrufbar 
unter: https://www.testdaf.de/fileadmin/Redakteur/PDF/TestDaF/ALTE/ALTE_Mindest- 
standards_DE.pdf, 21.07.2020. 


5 Fiir eine ausführlichere Erläuterung der spezifischen Merkmale der medizinischen Fachspra- 
che vgl. Roelcke 2005: 193ff. 
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und Sprechen herangezogen. Die Stufenbeschreibungen der Globalskala des 
GER wurden dem medizinischen Kontext fiir die Niveaustufen B2 und Cl 
angepasst® (Abb. 1, vgl. telc’). Sie zeigt in Gegenüberstellung die allgemeinen 
Kann-Beschreibungen auf C1-Niveau und die komplexen Kann-Beschreibun- 
gen für die Fertigkeit Sprechen im medizinischen Bereich, was den besonderen 
Bedarf an spezifischen Sprachkenntnissen verdeutlicht (vgl. Jehle 2019: 49): 


GER: SPRECHEN: 

Die Stufen-Beschreibungen Anamnese, Patientenvorstellung, 
der Globalskala Besprechung 

Kann ein breites Spektrum anspruchsvoller, Kann sich beinahe mühelos spontan und fließend 
längerer Texte verstehen und auch implizite im klinischen und privaten Alltag ausdrücken. Be- 
Bedeutungen erfassen. herrscht einen großen Wortschatz und kann bei 
Kann sich spontan und fließend ausdrücken, ohne find f H ~Patient / Angehörige) 
6fter deutlich erkennbar nach Worten suchen zu t Aa 4 

müssen. Kann Deutsch wirksam und flexibel für soziale und 


berufliche Zwecke gebrauchen, auch für den Aus- 
druck von Emotionen (empathisches Sprechen mit 
‚Angehörigen, Patienten, z.B. bei Sucht- oder Sozial- 
anamnese), Anspielungen oder zum Scherzen (mit 
Kann sich klar, strukturiert und ausführlich zu Kollegen in Small Talk-Situationen). 

komplexen Sachverhalten äußern und dabei 
verschiedene Mittel zur Textverknüpfung 


angemessen verwenden. t Sa hioninschs 8 jorheiten) klar und 


Kann die Sprache im gesellschaftlichen und 
beruflichen Leben oder in Ausbildung und 
Studium wirksam und flexibel gebrauchen. 


führen und alles mit einem angemessenen Schluss 
abrunden. 


Abb. 1: Auszug aus dem GER, Kann-Beschreibungen für Medizinerinnen und Mediziner (telc) 


Neben den geforderten Fremd- bzw. Fachsprachenkompetenzen und den vo- 
rausgesetzten medizinischen Fachkenntnissen sind für den beruflichen Alltag 


6 Das vorgestellte Sprachniveau B2-C1 wurde bewusst gewählt, da es sich dabei um die Kom- 
petenzstufen handelt, die zur Anerkennung im Ausland erworbener fachlichen Qualifikati- 
onen im medizinischen Bereich und zum Erhalt der Approbation bzw. Berufserlaubnis in 
Deutschland als Voraussetzung gelten (vgl. 87. GMK 2014: 3). 


7 Für eine zusammenfassende Darstellung vgl. Jehle 2019: 47f. Die vollständige Beschreibung 
der Kompetenzen von telc sind unter folgendem Link zu finden: https://www.telc.net/file- 
admin/user_upload/Broschueren/ger_poster_medizin.pdf, 21.07.2020. 
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und letztlich dessen Erfolg weitere Kompetenzen essenziell. Im Tatigkeitsfeld 
von Arzt*innen ist der multikulturelle Kontakt und Austausch mit Menschen 
allgegenwärtig, sodass ausgeprägte Sozialkompetenzen® und interkulturelle 
Kompetenzen sowie berufsübergreifende Schlüsselqualifikationen bzw. sog. 
soft skills benötigt werden. Die Beherrschung dieser Fähigkeiten manifestiert 
sich immer auch sprachlich, folglich lässt sich eine ‚sprachliche Handlungs- 
kompetenz‘ als übergeordnetes Ziel definieren. Handlungskompetenz wird 
dabei „[...] als die Bereitschaft und Befähigung des Einzelnen [verstanden], 
sich in beruflichen, gesellschaftlichen und privaten Situationen sachgerecht, 
durchdacht sowie individuell und sozial verantwortlich zu verhalten“ (KMK 
2018: 15). Zu diesen sprachlichen Fähigkeiten, sich als Ärztin/Arzt je nach 
Kontext und Gesprächspartner*in angemessen und seine Sprechabsichten 
adäquat auszudrücken, gehören auch nonverbale und paraverbale Aspekte 
der Kommunikation’, denen in verschiedenen Kommunikationsmodellen” 
Rechnung getragen wird. Diese können wiederum ebenfalls in unterschiedli- 
chen kulturellen Räumen divergieren (vgl. Kellnhauser & Schewior-Popp 1999: 
23ff). All diese Aspekte der ‚Sprachkompetenz‘ sollten m.E. auf dem Weg zur 
Berufsanerkennung bzw. -ausübung eine Rolle spielen. Hierbei stellt sich die 
Frage, inwieweit diese im Rahmen einer FSP bewertbar sind. Die Komplexität 
der medizinischen (Fach-)Sprache stellt die Prüfungsentwicklung zur Über- 
prüfung dieser Aspekte vor große Herausforderungen. In den Beschlüssen der 
87. GMK sind die Mindestanforderungen der FSP verankert und stellen die 
inhaltliche Grundlage dieser Prüfung(en) dar. 


8 Zur Diskussion der Berücksichtigung von Sozialkompetenzen als Auswahlkriterium bei 
Medizinstudiereden siehe bspw. https://blogs.faz.net/blogseminar/wie-misst-man-soziale- 
kompetenz/, 30.09.2020. 


9 Unter nonverbaler Kommunikation werden verstanden: Blick, Blickkontakt, Blickwechsel; 
Körperkontakt; Körperhaltung, Kleidung; räumliche Distanz; Mimik, Gestik. Als paralingu- 
istische Kommunikation bezeichnet man die Art und Weise, wie eine Botschaft weitergegeben 
wird. Dazu gehören: Lautstärke, Sprechgeschwindigkeit, Sprechpausen, Stimmvariationen” 
(Kellnhauser & Schewior-Popp 1999: 23). 


10 Für weitere Informationen vgl. bspw.: Emmerling, P. (2015): Ärztliche Kommunikation. Als 
Erstes heile mit dem Wort..., Stuttgart: Schattauer; Baller, G. & Schaller, B. (2017): Kommu- 
nikation im Krankenhaus. Erfolgreich kommunizieren mit Patienten, Arztkollegen und Klinik- 
personal, Berlin/Heidelberg: Springer; Bechmann, S. (2014): Medizinische Kommunikation. 
Grundlangen der ärztlichen Gesprächsführung, Tübingen: Narr. 
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1.2 Richtlinien des GMK-Beschlusses 


Die Beschlüsse der GMK gelten nicht nur als gesetzliche Grundlage der zur Be- 
rufsausübung erforderlichen Sprachnachweise, sondern geben auch Aufschluss 
über den inhaltlichen und zeitlichen Rahmen des abzulegenden Sprachtests. 
Diese gelten für Ärzt*innen, Zahnärzt*innen, Apotheker*innen sowie psycho- 
logische Psychotherapeut*innen und Kinder- und Jugendlichenpsychothera- 
peut*innen. Welche Kompetenzen die jeweilige Berufsgruppe mündlich wie 
schriftlich beherrschen muss und letztlich in der FSP überprüft werden sollen, 
sind ähnlich wie die in Kapitel 1.1 beschriebenen Kann-Beschreibungen des 
GER formuliert. Zusammengefasst ist dort für die Gruppe der Arzt*innen und 
Zahnärzt*innen Folgendes zu finden (vgl. 87.GMK 2014: 3): 


Personengruppen bzw. Gesprächspartner*innen: Patient*innen, Ange- 


hörige, Kolleg*innen und Angehörige anderer Berufe 
Arbeitssituationen: Anamnese; Information und Aufklärung über Be- 


funde, Erkrankungen, Behandlung(sverlauf) und geplante Maßnah- 
men; Patient*innenvorstellung; Krankenunterlagen führen 


Sprachhandlungen: Gesprächspartner*innen verstehen, sich spontan 
und fließend verständigen, informieren, aufklären, beschreiben, dar- 
stellen, sich klar und detailliert ausdrücken, ausstellen 


Dabei wird die Patienten*innensicherheit hervorgehoben, indem Missver- 
ständnisse, Fehldiagnosen, falsche Therapieentscheidungen und Therapiefeh- 
ler ausgeschlossen werden sollen. 

Daraus resultieren folgende Mindestanforderungen für den Sprachtest 
(87. GMK 2014: 6): 


Der Sprachtest umfasst 

e ein simuliertes Berufsangehöriger-Patienten-Gespräch, in dem die 
unter I.1 in Bezug auf die Kommunikation zwischen Berufsange- 
hörigen und Patienten beschriebenen Anforderungen unter Beweis 
gestellt werden (20 Minuten), 
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« das Anfertigen eines in der ärztlichen, zahnärztlichen, pharmazeu- 
tischen oder psychotherapeutischen Berufsausübung üblicherweise 
vorkommenden Schriftstückes (z.B. Kurz-Arztbrief) zum Nachweis 
der unter I.1 beschriebenen schriftlichen Sprachanforderungen 
(20 Minuten), 

e ein Gespräch mit einem Angehörigen derselben Berufsgruppe, [...] 
zum Nachweis der unter I.1. beschriebenen Anforderungen in Bezug 
auf die Zusammenarbeit mit Kolleginnen und Kollegen oder im Team 
(20 Minuten). 


Hier steht v.a. die Überprüfung des Hörverstehens sowie die mündliche und 
schriftliche Ausdrucksfähigkeit im Vordergrund. Es wird betont, dass das (me- 
dizinische) Fachwissen der Prüfungsteilnehmenden nicht überprüft werden 
darf. 

Außerdem wird festgelegt, dass der Sprachtest in Form einer Einzelprüfung 
stattfinden und die Bewertung durch mindestens zwei Prüfer*innen erfolgen 
muss. Davon hat mindestens eine Person Angehörige*r der Berufsgruppe zu 
sein, die auch der oder die zu Prüfende angehört und soll Deutsch als Mutter- 
sprache beherrschen (vgl. ebd.). Über das Bestehen des Sprachtests entscheidet 
das Bewertungsgremium. Welche Bewertungskriterien oder -formen dabei 
gelten, ist im Beschluss nicht weiter ausgeführt. Im Falle des Nicht-Bestehens 
ist ein beliebiges Wiederholen des ganzen Tests möglich (vgl. ebd.: 7). 

Grundsätzlich werden die Sprachtests bei der jeweiligen Ärztekammer oder 
Approbationsbehörde des Bundeslandes abgelegt, aber es wird auch die Mög- 
lichkeit eingeräumt, andere Nachweise anzuerkennen, solange die beschrie- 
benen Anforderungen damit belegt werden können. Liegt eine amtliche Be- 
scheinigung der erforderlichen (Fach)Sprachkenntnisse vor, sind die anderen 
Länder verpflichtet, diese auch zu akzeptieren. Insgesamt drückt die GMK 
aber das Bestreben einer bundeseinheitlichen Vorgehensweise aus (vgl. ebd.). 

Mit dem Inkrafttreten dieses Beschlusses entstand der Bedarfan Überprü- 
fungsmöglichkeiten der geforderten medizinischen Fachsprache und somit an 
einer Fachsprachenprüfung (FSP). Der Entwicklung von Deutsch-Prüfungen 
im Bereich Medizin nahm sich als Institution die telc gGmbH an, wobei die 
Konzeption und Durchführung in erster Linie an die jeweiligen Landesärzte- 
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kammern in ‚Eigenregie‘ übertragen wurde. Angesichts dessen kann hier nicht 
von einer bundeseinheitlichen Prüfungsvorgehensweise gesprochen werden. 
Zu diesem Schluss kommen auch Malakhova & Lenz nach Überprüfung dieser 
Hypothese anhand von Daten über Ablauf, Dauer, Gebühren, Teilnehmenden 
und Durchfallquoten für die Jahre 2014-2017, trotz teilweise mangelhafter 
Zugänglichkeit der Daten seitens der Ärztekammern (vgl. 2018: 1) und fordern 
ebenfalls eine Vereinheitlichung der FSP (vgl. ebd.: 3). 

Die durch die GMK reglementierte FSP hat zum Ziel, zugewanderte 
Ärzt*innen einheitlich zu prüfen, um eine kompetente Sprachverwendung 
im ärztlichen Berufsfeld festzustellen. Jedoch sind Prüfungen dieser Art nicht 
unumstritten und bergen Herausforderungen und Schwierigkeiten, worauf 
sich der folgende Abschnitt konzentriert und den Blick auf die Prüfungspraxis 
einbezieht. 


1.3 Herausforderungen und Probleme der FSP 


Die Herausforderungen bei der Entwicklung einer validen Fachsprachenprü- 
fung bestehen aus der Berücksichtigung von Elementen aus dem jeweiligen 
Fachbereich, der Testmethodik, der Fach- und Fremdsprachendidaktik (Me- 
dizin und Deutsch als Fremdsprache) und der Psychometrie (vgl. Lenz et al. 
2019: 0.S.). 

Hinsichtlich des in Kapitel 1 beschriebenen Ziels einer authentischen Prü- 
fung entsteht ein „methodisches Dilemma“ (Rossa 2016: 400): 


Je komplexer die erfasste Leistung ist, die in subjektiv bedeutsamen 
Kontexten und ggf. in Interaktion mit mehreren [Sprechenden, N. J.] 
erfasst wird, desto eher kann sie als repräsentatives Beispiel für die 
Kompetenzen der Testteilnehmenden gelten. Mit der Komplexität der 
Leistung steigt aber auch die Schwierigkeit, die Messung reliabel und 
objektiv durchführen zu können (ebd.), 


da sich die individuellen Äußerungen der Prüfungsteilnehmenden u.U. nicht 


mehr eindeutig den Kategorien eines Bewertungsschemas zuordnen lassen 
(vgl. ebd.). Folglich schaffen detaillierte Bewertungskriterien Abhilfe. Je spe- 
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zifischer diese sind, „desto schwieriger ist es jedoch [...], alle Kategorien bei 
der Testdurchführung gleichermaßen im Blick zu behalten“ (Handt 2012: 190). 
Besonders bei der Bewertung mündlicher Leitungen sei es kaum möglich, 
als Bewerter*in „auf mehr als drei oder vier Kriterien gleichzeitig zu achten“ 
(ebd.) wie bspw. „Berücksichtigung (vorgegebener) Leitpunkte, kommunika- 
tive Gestaltung und formale Richtigkeit“ (ebd.). Bei der FSP übernehmen die 
Prüfenden in der Regel auch die Rolle der/des Gesprächspartnerin/-partners 
eines simulierten Prüfungsgesprächs, was die Konzentration auf die Bewertung 
erschwert. Dabei nimmt gerade die reliable Bewertung der produktiven Leistun- 
gen hinsichtlich der Testgüte eine Schlüsselfunktion ein, was nur durch geschul- 
te Bewerter*innen sichergestellt werden kann (vgl. Perlmann-Balme 2016: 423). 
Dies verlangt neben einer standardisierten Prüfer*innenschulung auch eine 
regelmäßige und systematische Kontrolle seitens der Testanbieter (vgl. ebd.) 

Ein weiterer Punkt ist die mangelnde Transparenz, da es seitens der Ärz- 
tekammern kaum detaillierte Veröffentlichungen der Bewertungskriterien der 
vorhandenen Fachsprachenprüfungen gibt, was zu einer schlechteren Vorberei- 
tungsmöglichkeit seitens der Teilnehmenden, aber auch der Prüfenden führt. 
Demnach hängt die Bewertung stark von deren Einschätzungen der Kenntnisse 
der/des Prüfungsteilnehmenden ab (vgl. Dippold-Schenk 2018: 41). Kritisiert 
wird außerdem, dass die FSP fast ausschließlich von Ärzt*innen konzipiert 
wird und keine Zusammenarbeit von Sprachwissenschaftler*innen und Medi- 
ziner*innen stattfindet (vgl. Deppe & Borowski et al. 2015: 27). Dies betrifft auch 
die Zusammensetzung der Prüfungskommission der Ärztekammern: Ärzt*in- 
nen sind obligatorisch, Sprachwissenschaftler*innen nicht (vgl. 87. GMK 2014: 
6). Dabei wird angenommen, dass es aufgrund dessen zu einer Vermischung 
von fachsprachlichen Merkmalen und Sprachkenntnissen kommt (vgl. Deppe 
& Borowski et al. 2015: 37). Die alleinige Bewertung durch Ärzt*innen könne 
dagegen zu einer weniger fundierten Beurteilung führen, da Mediziner*innen 
nicht über die „angemessenen Diagnoseinstrumente“ (ebd.) verfügen. Während 
der Prüfung würden so eher die medizinischen Aussagen bewertet und es werde 
vom sprachlichen Schwerpunkt abgekommen (vgl. ebd.). 

Bei dieser Art eines offenen Prüfungsformats, bei dem die Sprachproduk- 
tion im Rahmen der Aufgaben ‚frei‘ erfolgt, wird die „face validity“ (Handt 
2012: 190) angeführt, was bedeutet, dass „eine hohe Entsprechung zwischen 
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dem Testformat und der Art von Verstehen oder Kommunikation, die man 
abtesten will, [besteht, N. J.]“ (ebd.). Diese fordert auch sog. „integrierte Auf- 
gabenformate“ (ebd.), was eine Verbindung der Teilfertigkeiten, z.B. Lesen 
und Sprechen, zu Gunsten einer authentischen Kommunikation bedeutet. Bei 
einer solchen Testkonstruktion lässt sich jedoch die Ursache für weniger gute 
Leistungen schwieriger nachvollziehen, da sie auf Probleme beim Verstehen 
oder der aktiven Produktion zurückgeführt werden können (vgl. ebd.). 
Kritik an den Prüfungen, die im Zuge der GMK-Beschlüsse anfänglich zur 
Verfügung standen, kam auch von Roche. Einerseits nehmen die Prüfungen 


die medizinische Umgangssprache und berufssprachliche Kompeten- 
zen selektiv in den Blick, umfassen in der Regel nur begrenztes Fach- 
vokabular, behandeln wenige schriftliche Textsorten und so gut wie 
keine wissenschaftliche, medizinische Fachsprache (Roche 2014: 317), 


andererseits sind die Sprachtests meist geringer auf Fach- und Berufssprache 
ausgelegt und daher in Bezug auf medizinsprachliche Kommunikationskom- 
petenz nur wenig aussagekräftig (vgl. ebd.). Des Weiteren merkt er an, dass 
„viele Tests und Materialien immer noch ad hoc und ohne wissenschaftlich 
belastbare Systematik entwickelt [werden, N. J.]“ (ebd.). 

Neben der Entwicklung betreffen die meisten der aufgeführten Schwierig- 
keiten und Herausforderungen der FSP die praktische Durchführung, nicht 
zuletzt aufgrund ihrer unterschiedlichen Ausführungen. 

Eine Auflistung des Marburger Bunds (2018) gibt eine Übersicht der im je- 
weiligen Bundesland anerkannten bzw. zu absolvierenden FSP. Diese verdeut- 
licht, dass von einer „undurchsichtigen und schwer durchschaubaren“(ebd.) 
Prüfungslandschaft gesprochen werden kann. Darauf zurückzuführen ist der 
sich entwickelnde bzw. bereits existierende ‚Prüfungstourismus‘ (vgl. Malak- 
hova & Lenz 2018: 1). Der Prüfungsort ist vom Wohnort bzw. dem offiziel- 
len Wohnsitz der Teilnehmenden abhängig. In Internetforen", einschlägigen 
Facebook- oder Whatsapp-Gruppen und auch innerhalb von Prüfungsvor- 
bereitungskursen herrscht ein reger Austausch über praktische Erfahrungen 


11 Vgl. bspw. http://approbations.info/blog/, 28.07.2020. 
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und Empfehlungen sowie dartiber, wo die FSP vermeintlich am einfachsten 
ist. Ausländische Arzt*innen ziehen sogar in ein anderes Bundesland, um 
die Chancen auf das Bestehen der Prüfung und damit einer beruflichen Per- 
spektive in Deutschland zu erhöhen”. Ist einmal eine FSP bestanden, sind 
alle Bundesländer laut den GMK-Beschlüssen dazu verpflichtet, diese auch 
anzuerkennen (vgl. 87. GMK 2014: 7). Aufgrund der damit einhergehenden 
langwierigen Bürokratie bestimmt jedoch oft der Ort der Prüfung auch den 
Arbeitsort, womit dem Ärzte*mangel in bestimmten Regionen sicherlich nicht 
geholfen ist. Ein einheitliches Prüfungssystem würde dem Prüfungstourismus 
entschieden entgegenwirken. 

Die Probleme und Herausforderungen lassen sich wie folgt zusammenfassen: 


1. Konzeption und Entwicklung: Berücksichtigung aller beteiligten 
Fachbereiche 
Test und Material: wissenschaftlich fundiert 
offenes Prüfungsformat: Verbindung der Teilfertigkeiten 
— Ursache für weniger gute Leistungen schwieriger nachvollziehbar 

4. Ziel: authentische fremd-/fachsprachliche Leistung führt zu Kom- 
plexität der Leistung 

5. Rollenübernahme der Gesprächspartner*innen bei Prüfungsteilen 
seitens der Prüfenden 
— Schwierigkeit einer reliablen und objektiven Messung 

6. geschulte Bewerter*innen = Schlüsselfunktion für reliable Bewer- 
tung der produktiven Leistungen 
— standardisierte Prüfer*innenschulung/Kontrolle seitens Testan- 
bieter 

7. Prüfungskommission: Zusammensetzung meist nur aus Ärzt*in- 
nen, keine Sprachwissenschaftler*innen (DaFler*innen) 
—> weniger fundierte Beurteilung/Bewertung mit sprachlichem 
Schwerpunkt 


12 Diese Informationen stammen aus informellen Gesprächen (im Juli 2020) mit einem Kurs- 
träger in Mainz, deren Kursteilnehmenden darüber berichteten und dies als Grund des Kurs- 
abbruches angaben. 
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8. Transparenz: Zugang zu Material zur Vorbereitung (z.B. Modell- 
tests) und Bewertungskriterien etc. 

9. uneinheitliches Prüfungssystem: unterschiedliche Ausführungen je 
nach Bundesland 
— Prüfungstourismus 

10. Anerkennungspflicht aller FSP seitens der Bundesländer, aber lang- 
wierige Bürokratie 
> wirkt Deckung des Arzte*mangels in bestimmten Regionen ent- 


gegen 


Die Testentwickler*innen des SAM erklären als Ziel, „den Sprachtest mittelfris- 
tig als Beitrag zu einer nachhaltigen Verbesserung gegenwärtiger Testverfahren 
zum Einsatz zu bringen, nicht nur in Bayern“ (Lenz et al. 2019: 0.S.). Was der 
SAM im Vergleich zu den etablierten FSP leistet, gilt es demnach näher zu 
betrachten. 

Im Folgenden wird zunächst das Forschungsdesign präsentiert (Kapitel 
2), auf dessen Grundlage meine Analyse durchgeführt wurde. Daran an- 
schließend werden die exemplarisch ausgewählten FSP sowie der SAM in 
ihren Grundzügen vorgestellt (Kapitel 2.1) und im darauffolgenden Kapitel 
(2.2) evaluiert. 


2 Analysevorhaben und Forschungsdesign 


Das Vorhaben, einen exemplarischen Vergleich vorhandener Prüfungsformate 
mit dem neu entwickelten SAM durchzuführen, erfolgt mittels eines Daten- 
und Methoden-Mix. Als Methoden wurden hierbei die Dokumentenanalyse 
und ein (Experten-)Interview eingesetzt. Für eine Bestandsaufnahme sowie 
die Analyse der Prüfungen dienten fachrelevante Dokumente v.a. seitens der 
Prüfungsanbieter bzw. Arztekammern und einer der SAM-Testentwickler*in- 
nen als Daten- bzw. Informationsquellen. 

Die Dokumentenanalyse sollte Aufschluss zu den Prüfungsdetails geben. 
Aus den Erkenntnissen der Inhaltsanalysen wurde für das Interview ein Leit- 
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faden erstellt. Das mit einem der Testentwickler des SAM geführte Interview” 
diente zur Vertiefung und ermöglichte, die Perspektive der Testentwicklung 
einzubeziehen. 

Der Vergleich und die Analyse der Prüfungen erfolgte auf der Basis der in 
Kapitel 1 vorgestellten Aspekte hinsichtlich der testtheoretischen und inhaltli- 
chen Anforderungen an die FSP. Hierfür werden die exemplarisch angeführten 
Prüfungen in Bezug auf folgende Punkte hin analysiert: Aufbau, Anforderun- 
gen, Ablauf, Material, Bewertung, Prüfer*innen. Die Bewertungsgrundlage 
stellten dabei die Erfüllung der Gütekriterien und die inhaltliche Umsetzung 
der GMK-Beschlüsse dar, die letztlich über die Testgüte entscheiden. Im An- 
schluss sollte damit auszugsweise geklärt werden können, ob die etablierten 
FSP bzw. der neu entwickelte SAM den Test-Anforderungen gerecht werden 
und sie als valider Nachweis der komplexen Sprachkompetenzen gelten kön- 
nen. Zunächst werden dafür die drei Testformate in ihren Grundzügen vorge- 
stellt, bevor diese nach den o.a. Kriterien analysiert werden. 


2.1 Prüfungsvorstellung 


In den folgenden Abschnitten werden exemplarisch zwei etablierte und aner- 
kannte Fachsprachenprüfungen, die telc Deutsch B2-C1 Medizin Fachsprach- 
prüfung und die rheinland-pfälzische FSP sowie der neu entwickelte Sprachtest 
für ausländische Mediziner (SAM) präsentiert. 


2.1.1 tele Deutsch B2-C1 Medizin Fachsprachprüfung 


telc ist eine gemeinnützige gGmbH sowie ein Tochterunternehmen des Deut- 
schen Volkshochschul-Verbands e. V. mit Zentrale in Frankfurt a. M. und zählt zu 
den führenden Anbietern standardisierter Sprachprüfungen, die international 
anerkannt sind. telc bietet über 90 zertifizierte Sprachtests in zehn Sprachen 
auf allen Kompetenzstufen des GER an. Die Testauswertung und Zertifizierung 


13 Das Interview wurde mit Holger Lenz im Juli 2020 geführt. Er ist wissenschaftlicher Mit- 
arbeiter am Institut für Didaktik und Ausbildungsforschung in der Medizin am Universi- 
tätsklinikum der LMU in München. Dort leitet er u.a. das OFIF-Projekt zur Förderung der 
Kommunikationsfähigkeit internationaler Studierender der Humanmedizin und war an der 
Entwicklung des SAM beteiligt. 
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dieser Prüfungen als auch die Schulung und Lizenzierung der Prüfer- und 
Bewerter*innen gehören zu ihren Aufgaben (vgl. telc-a). Im Bereich Heilbe- 
rufe wurden vier verschiedene Prüfungen entwickelt: drei im Bereich Medizin 
und eine im Bereich Pflege auf B1/B2-Niveau (vgl. telc-b). Im Rahmen dieses 
Beitrags wird lediglich die zur Beantragung der Approbation bzw. Berufser- 
laubnis'* anerkannte telc Deutsch B2-C1 Medizin Fachsprachprüfung betrachtet. 

Diese orientiert sich laut telc eng am Beschluss der 87. GMK (vgl. telc-c). 
Folglich werden sowohl allgemeinsprachliche Kenntnisse auf B2 als auch 
fachsprachliche auf C1-Niveau geprüft. Die Kenntnisse werden in allen vier 
Fertigkeiten, Hören, Lesen, Schreiben und Sprechen abgefragt (ausführlich 
im Anhang). Der schriftliche Teil umfasst die drei Aufgaben Hörverstehen, 
Lesen und Sprachbausteine und ist bei maximaler Bearbeitungszeit von 80 
Minuten im Gegensatz zu den anderen telc-Prüfungen im Bereich Medizin 
nicht so umfangreich. Bei der mündlichen Prüfung handelt es sich um eine 
60-minütige Einzelprüfung, in der die Schreibkompetenz (das Verfassen eines 
Kurz-Arztbriefs) unter einer Vorbereitungszeit von fünf Minuten integriert ist. 
Beide Prüfungsteile sind dabei gleichgewichtet, wobei bei der Einzelprüfung 
die mündlichen Teile 1 und 3 zusammen mit maximal 35 Punkten bewertet 
werden. 

Zum Bestehen dieser Prüfung sind im schriftlichen und mündlichen Teil 
je 60%, sprich 30 Punkte von maximal 50 erreichbaren je Teil, notwendig (vgl. 
Fachsprachprüfung Ubungstest 1). 

Für alle Prüfungen gelten die allgemeinen Bewertungskriterien von telc, 
die sowohl sprachliche als auch inhaltliche Angemessenheit berücksichtigen: 
Für den schriftlichen Teil (Kurz-Arztbrief) werden inhaltliche Angemessenheit/ 
Aufgabenbewältigung, Kommunikative Gestaltung, Korrektheit und Wortschatz 
bewertet (vgl. ebd.: 37f.). Beim mündlichen Teil sind das: die inhaltliche Auf- 
gabenbewältigung und in Bezug auf die Sprache: Aussprache/Intonation, Flüs- 
sigkeit, Korrektheit und Wortschatz (vgl. ebd.: 39f.). Die Bewertung des schrift- 
lichen Teils der Prüfung kann nur eine approbierte Ärztin/ein approbierter 


14 Miteiner Berufserlaubnis kann im Krankenhaus oder einer Praxis gegen Bezahlung gearbeitet 
werden (max. zwei Jahre). Eine Weiterbildung zu einer Facharztqualifikation ist erst nach 
Erhalt der Approbation möglich (vgl. Bezirksärztekammer 2020a: 2). 
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Arzt oder die/der Inhaber*in einer telc Bewerterlizenz'> übernehmen. Aquiva- 
lent dazu wird die mündliche Prüfung von approbierten Arzt*innen oder telc- 
lizenzierten Priifer*innen abgenommen, wobei die/der approbierte Arztin/Arzt 
sowohl die Rolle der Patientin/des Patienten bei der Anamnese als auch der/ 
des Kolleg*in bei der Fallvorstellung tibernimmt. Die jeweilige Gesamtpriifung 
kann beliebig oft wiederholt werden, wobei die Kosten fiir die Priifung vom 
jeweiligen Testzentrum selbst festgelegt werden (vgl. telc Deutsch-Prüfungen 
für Ärztinnen und Arzte)'®. Diese Prüfung ist als offizieller Nachweis in Hessen, 
Saarland und Schleswig-Holstein anerkannt (vgl. Marburger Bund 2018). 


2.1.2 Ärztliche Fachsprachenprüfung Rheinland-Pfalz!” 


Die ärztliche Fachsprachenprüfung in Rheinland-Pfalz wird im Auftrag der 
Landesärztekammer Rheinland-Pfalz und des Landesamtes für Soziales, Jugend 
und Versorgung (LSJV) in Koblenz von der Bezirksärztekammer Rheinhessen 
durchgeführt, von der aktuell 4.800 Ärzt*innen betreut werden (vgl. BÄK: 
o.J.). Die dort durchgeführte Prüfung ist die einzige in RLP zur Beantragung 
der Approbation bzw. Berufserlaubnis anerkannte FSP (vgl. Marburger-Bund 
2018: 4). Der Wohnort bzw. das Nachweisen eines konkreten Arbeitsangebots 
ist Bedingung für das Ablegen der Prüfung in RLP bzw. dem jeweiligen Bun- 
desland. Die Anmeldung zur Prüfung ist nur nach Erhalt einer qualifizierten 
Eingangsbestätigung des LSJV im Zuge der Beantragung auf Approbation bzw. 
Berufserlaubnis möglich. Zudem sollte ein Sprachzertifikat vorliegen'®, wobei 
das Niveau (nach GER) hierbei nicht spezifiziert ist. 


15 Bei telc wird zwischen einer Bewerterlizenz für das Bewerten schriftlicher Leistungen und 
einer Prüferlizenz für die mündlichen Prüfungsteile unterschieden. Weitere Informationen 
siehe unter: https://www.telc.net/lehrkraefte/pruefer-und-bewerter/telc-lizenz-erwerben. 
html, 25.07.2020. 


16 Mehr Informationen zu allen telc-Prüfungen im Bereich Heilberufe sind abrufbar unter: 
https://www.telc.net/medizin-pflege/kurstraeger-lizenzpartner/sprachpruefungen/medizin. 
html, 20.09.2020. 


17 Vgl. die Studie von Jehle zur FSP Rheinland-Pfalz in diesem Band. 


18 Hier liegt eine deutliche Diskrepanz zwischen der Auflistung der für den FSP-Antrag benötig- 
ten Unterlagen auf der Informationsseite der Ärztekammer und der praktischen Handhabung 
vor. Siehe dazu Umfrage im Beitrag von Jehle in diesem Band. 
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Nach erfolgreicher Anmeldung erwartet die Prüfungsteilnehmenden eine 
2,5-3 stündige Absolvierung (inkl. Wartezeiten) mit fünf bzw. sechs Teilen 
und mehreren Abschnitten, die unterschiedliche Wertigkeit für die Gesamt- 
prüfung haben”: 


1. Verständnistest (vorher Vokabeltest): Hier werden je 20 medizini- 
sche Begriffe aus der Fachsprache in das Deutsche von Patient*in- 
nen übersetzt und umgekehrt sowie eine Schemazeichnung des 
Körpers mit medizinischen Bezeichnungen beschriftet bzw. aus- 
gewählte Körperteile (in Laiensprache) unterschiedlich markiert. 
Für die Vorbereitung dieser Aufgaben wird die Arbeit mit medizi- 
nischen Wörterbüchern empfohlen. 

2. Freies Gespräch mit folgender Erläuterung: „Hier werden die Prüfer 
Ihnen Fragen stellen, um zu beurteilen, wie gut Sie Sprache verste- 
hen und wie gut Sie Antworten formulieren können“. 

3. Ein 20-minütiges Arzt*-Patienten*-Gespräch (Anamnesegespräch/ 


Patienten*aufklärung) in laienverständlicher Alltagssprache. Nicht 
eine vollständige Anamnese, sondern das Sprechen, Verstehen und 
Reagieren auf Patient*innen steht hierbei im Vordergrund und 
führt bei Nichtbeachten der Aussagen und Fragen dieser zu erheb- 
lichem Punkteverlust. 

4. Abfassen eines Schriftstücks (Kurz-Arztbrief): Hier soll eine ak- 


tuelle Anamnese in Form eines Fließtexts geschrieben und die er- 


fragten Informationen aus dem vorangegangen Anamnesegespräch 
stichwortartig erfasst werden. In Fachsprache folgen Ausführungen 
zu Verdachts- und Differenzialdiagnose(n) und zur zuvor mit der/ 
dem Patient*in mündlich besprochenen Untersuchungsforderung. 
Hierfür bekommen die Prüfungsteilnehmenden einen vierseiti- 
gen Anamnesebogen zum Ausfüllen, der auf der Internetseite zur 


19 Die Ausführungen beruhen auf den auf der Internetseite der Bezirksärztekammer veröf- 
fentlichen Angaben(vgl. BÄK 2020a). Trotz zusätzlicher ‚Ablaufhinweise zur FSP in Mainz‘ 
(vgl. BÄK 2020b) geben sie nicht umfassend Aufschluss z.B. zu Details der Prüfungsteile, 
Bewertungskriterien und Prüfer*innen. Auf meine Anfrage bei der Kammer wurde leider 
nicht reagiert. 
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Vorbereitung einsehbar und herunterladbar ist”. Inkludiert ist das 
Ausfüllen von u.U. davon unabhängigen Anforderungsscheinen für 
weiterführende Untersuchungen. 

5. Aufgaben zum Lese- und Hörverstehen sowie ein Arzt*-Arzt*-Ge- 


spräch (was nach Hinzufügen des ‚freien Gesprächs‘ eigentlich Teil 
6 darstellen müsste?!): Hier werden zu einem einseitigen Text (z.B. 
Befunde oder Arztbrief) drei Fragen auf einem Vordruck schriftlich 
beantwortet. Außerdem werden per Telefon (zwei Anrufe) patien- 
tenbezogene Informationen (z.B. aus dem Labor) übermittelt, die 
im Prüfungsbogen zu notieren sind. Bei dem Gespräch von Ärztin/ 
Arzt zu Ärztin/Arzt handelt es sich um ein Fachgespräch, bei dem 
in berufstypischer Sprache ein Bericht über die/den Patient*in aus 
Teil 1 oder die schriftlich bzw. akustisch übermittelten Informa- 
tionen aus Teil 4 oder sonstige medizinische Themen erfolgt. An 
dieser Stelle wird betont, dass es nicht um medizinisches Fachwissen 
und dessen Überprüfung geht, sondern um „die Fähigkeit, sich gut 
auszudrücken und sich fachsprachlich miteinander verständigen zu 
können“. Medizinische Fehler oder fehlendes medizinisches Wissen 
werden nicht bewertet. 


Die vorgestellten Prüfungsteile können hierbei in unterschiedlicher Abfolge 
geprüft werden (vgl. BÄK 2020a: 2). Dies übernehmen in der Regel zwei appro- 
bierte Ärzt*innen, die auch die Rolle der Gesprächspartner*in (Patient*in und 
Kolleg*in) einnehmen. Für das Bestehen muss jeder Prüfungsteil mit einer ihm 
zugeordneten Mindestpunktzahl abgeschlossen werden, wobei das Nichterrei- 
chen der erforderlichen Mindestpunkte in einem Teil zum sofortigen Abbruch 
der Prüfung führt. Die Prüfung gilt insgesamt als bestanden, wenn die Gesamt- 
punktzahl aus allen Prüfungsteilen bei über 60% liegt, d.h. eine Addition der 


20 Anamnesebogen verfügbar unter: https://aerztekammer-mainz.de/pdf/diverse/FSP-Anam- 
nesebogen-2020.pdf, 11.08.2020. 


21 Letzte Änderungen des Prüfungsablaufs bzw. der -teile erfolgten im Juni/Juli 2020. Zuvor: 
1. Vokabeltest (ohne Körperschema), 2. Arzt*-Patienten*-Gespräch, 3. Verfassen eines Schrift- 
stücks (Kurz-Arztbrief), 4. Lese- und Hör-Verstehen, 5. Arzt*-Arzt*-Gespräch. Gründe für 
die Ergänzungen sind nicht genannt. 
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Mindestpunktzahlen aus allen Priifungsteilen ist nicht ausreichend und muss 
durch höhere Punktzahlen in anderen Teilen ausgeglichen werden (vgl. ebd.). 
Das Prüfungsergebnis wird direkt im Anschluss an die Prüfung (mündlich) be- 
kannt gegeben und bei bestandener Prüfung eine Bescheinigung (im Original) 
ausgestellt. Im Falle des Nichtbestehens kann die Prüfung wiederholt werden. 
Die Kosten für die Prüfung liegen derzeit bei 425€ (vgl. ebd.: 1). 


2.1.3 SAM - Sprachtest für ausländische Mediziner 


Beim Sprachtest für ausländische Mediziner (SAM) handelt es sich um eine FSP, 
die an der LMU München in Kooperation mit dem Klinikum der Universi- 
tät von einem Expert*innen-Team mehrerer Fachdisziplinen (Didaktik und 
Ausbildungsforschung in der Medizin, Deutsch als Fremdsprache, Empirische 
Pädagogik und pädagogische Psychologie) mit der Unterstützung und Förde- 
rung des Bayerischen Staatsministerium für Gesundheit und Pflege (StMGP) 
2018 entwickelt und bereits pilotiert wurde. Das Ziel war dabei die „Entwick- 
lung einer wissenschaftlich fundierten und standardisierten Fachsprachen- 
prüfung für das Bundesland Bayern“ (Lenz et al. 2019: 0.S.), die „in situativen 
Prüfungsstationen [...] fachsprachliche und kommunikative Kompetenzen 
auf C1-Niveau abprüfen [soll, N. J.]“ (ebd.). Voraussetzung zur Ablegung der 
Prüfung ist ein allgemeinsprachliches B2-Zertifikat. Die Vorgaben der GMK 
dienen auch bei dieser FSP als inhaltliche Grundlage, wobei der Aufbau einen 
großen Unterschied zu den bisherigen Prüfungen aufweist. Er beinhaltet zwar 
die per GMK-Beschluss festgelegten drei Prüfungsbereiche, diese wurden je- 
doch um jeweils einen ergänzt, sodass die gesamte Prüfung aus sechs Einzel- 
teilen besteht. Im Bereich des Arzt*-Patienten*-Gesprächs erfolgt demnach 
neben der Anamnese ein OP-Aufklärungsgespräch. Der Kurz-Arztbrief zum 
Anamnese-Teil wird durch das Anfertigen des Teils Verlauf und Prozedere 
erweitert. Zudem ist bei dieser Prüfung sowohl ein Arzt*-Arzt*-Gespräch als 
auch ein Gespräch bzw. Telefonat mit einer/einem Angehörigen eines anderen 
Heilberufs (hier: Pflegepersonal) vorgesehen (vgl. Abb. 2). 
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SAM - Sprachprüfung für 


ausländische Mediziner 


7 | \ 


Drei Prüfungsbereiche (per GMK-Beschluss festgelegt) 


Ein simuliertes Anfertigen eines in der ärztlichen Ein Gespräch mit einem 


Berufsangehöriger-Patienten- Praxis üblicherweise Angehörigen derselben 
Gespräch (20 Minuten) vorkommenden Schriftstücks (20 Berufsgruppe (20 Minuten) 


Minuten) | 


| | | 


| Je zwei Stationen pro Prüfungsbereich im SAM 


Führen eines Anamneseteil eines Arztbriefs Gesprach mit einem 
Anamnesegesprachs formulieren Arzt/Kollegen 


Aufklarungsgesprach vor Verlauf und Procedere eines Telefonat mit einem 
einem operativen Eingriff Arztbriefs formulieren Angehörigen eines anderen 
Heilberufs (Krankenpfleaer/in) 


Abb. 2: Schematischer Aufbau des SAM unter der Berücksichtigung der GMK- 
Mindestanforderungen (Lenz et al. 2019: Abb. 1) 


Für die vier Gespräche werden inklusive Vorbereitung je 10 Minuten und für 
die schriftlichen Teile nochmals 40 Minuten (2 x 20 Minuten) zur Durchfüh- 
rung angesetzt. 

Die Fallvignetten für die vier mündlichen Teile des Tests stammen aus 
den Fachbereichen Allgemeinmedizin, Innere Medizin und Chirurgie. Die 
Wahl dieser Bereiche entspricht vorwiegend denen, die im 3. Staatsexamen 
vor Erhalt der Approbation sowie in der Kenntnisprüfung bei ausländischen 
Ärzt*innen aus Drittstaaten integriert sind. Komplexe fachspezifische Inhalte 
werden laut Testautor*innen bei den Fallszenarien vermieden, um die Prü- 
fungsteile unabhängig von der fachlichen Spezialisierung der Prüfungsteil- 
nehmenden bewältigen zu können (vgl. Lenz et al. 2019: 0.S.). Anders als bei 
den anderen Prüfungen, erhalten die Teilnehmenden zu jedem Gespräch bzw. 
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bei jeder Station einen unterschiedlichen medizinischen Fall, was ebenso bei 
den zwei schriftlichen Teilen der Prüfung der Fall ist. Hier soll anhand einer 
auf Video gezeigten Anamnese ein Kurz-Arztbrief erstellt sowie auf Grund- 
lage von kommentierten Laborberichten der Teil Verlauf und Prozedere des 
Arztbriefes verfasst werden. Beide Teile entsprechen den i.d.R. vier typischen 
Strukturelementen eines Arztbriefes, die durch eine hohe (fach-)sprachliche 
Anforderung gekennzeichnet sind (vgl. ebd.). Bei diesen Teilen wird v.a. die 
„Rezeptionsfähigkeit und Verarbeitung sprachlichen Inputs sowie die schrift- 
liche Ausdrucksfähigkeit“ (ebd.) geprüft. 

Der Aufbau und die Zeitverteilung des SAM entsprechen dem im medizi- 
nischen Kontext international etablierten OSCE-Format (Objective Structured 
Clinical Examination), das als valides und reliables Instrument zur Überprü- 
fung klinisch-praktischer Fähigkeiten gilt und sich darüber hinaus „für die 
Messung kommunikativer Kompetenzen in kulturellen und professionellen 
Kontexten eignel[t]“ (Bagnasco et al. (2016) zit. in: Lenz et al. 2019: 0.S.)”. Die 
mündlichen Teilbereiche werden hierbei, im Gegensatz zu den anderen Prii- 
fungen, per Video über eine testinterne Software aufgezeichnet. Dieses Verfah- 
ren gilt dann als sog. VOSCE (Video-Recorded Objective Structured Clinical Ex- 
amination) und ist ein bewährtes Instrument zur Bewertung kommunikativer 
Fahigkeiten in medizinischen Kontexten (vgl. Lenz et al. 2019: 0.S.). Bei dieser 
Priifungs- und Bewertungsform übernehmen geschulte Schauspielpatient*in- 
nen und externe Ärzt*innen die Rolle der jeweiligen Gesprächspartner*innen, 
wofür sie, neben einem Training, ein Skript mit Gesprächsanleitungen und 
Zusatzfragen erhalten. Die Prüfungsbewertung findet also nicht während der 
Prüfung durch die Anwesenden, sondern asynchron durch externe Bewer- 
ter*innen statt. Dieses Vorgehen wird bspw. auch beim TestDaF angewandt. 

Das Bewerter*innen-Team besteht aus einer Ärztin/einem Arzt und einer/ 
einem Sprachwissenschaftler*in mit testmethodischem Fachwissen zu Deutsch 


22 Mehrzum OSCE-Format vgl. bspw. Nikendei C. & Jünger J. (2016): „OSCE - praktische Tipps 
zur Implementierung einer klinisch-praktischen Prüfung‘; in: GMS Z Med Ausbild. 2006 23/3, 
(Doc 47), abrufbar unter: http://www.egms.de/static/de/journals/zma/2006-23/zma000266. 
shtml, 28.07.2020, Brandes H. (2006): Überprüfung kommunikativer Fähigkeiten der Studieren- 
den des Reformstudienganges Medizin der Charite Berlin mit Hilfe einer OSCE-Station, Berlin: 
Charite Universitätsmedizin Berlin, Medizinischen Fakultät. 
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als Fremdsprache, die fiir die Pilotierung seitens der Testautor*innen geschult 
wurden. Hierfür müssen pro Teilstation zwischen 11 und 17 Items bewertet 
werden, was einer Gesamtzahl von 83 Items entspricht. 

Dem Bewerter*innen-Team stehen daftir eine Bewertungsskala je Teil, als 
auch ein Beiblatt mit (sprachlichen und inhaltlichen) Ausführungen der Be- 
wertungskriterien zur Verfügung. Die Skalen sind immer in drei Kategorien 
unterteilt, die sich je nach Prüfungsteil und sprachlicher/kommunikativer 
Handlung unterscheiden (vgl. Abb. 3). 


Anamnese-Gespräch Arztbrief: Verlauf und Prozedere 

1) Erfassung der gesundheitliche Probleme 1) Zusammenfassen der Angaben 

2) Kommunikatives Verhalten 2) Sprachliche Gestaltung 

3) Gesamtbewertung 3) Gesamtbewertung 

Beurteilung: jeweils mit trifft eher zu (1 Pkt.) - uneindeutig (0,5 Pkt.) - trifft eher nicht zu 
(0 Pkt.) 


Abb. 3: Bewertungskategorien am Beispiel für das Anamnese-Gespräch und den Teil Arztbrief 
‚Verlauf und Prozedere‘ 


Die Bewertung erfolgt zunächst getrennt, anschließend werden die Ergebnisse 
verglichen, wobei sich das Bewerter*innen-Team schließlich einstimmig über 
das Bestehen oder Nicht-Bestehen einigen muss. Dies erfordert eine Mindest- 
punktezahl pro Teilbereich. Die Gleichgewichtung aller Teilstationen soll dabei 
durch eine nachträgliche Anpassung? sichergestellt werden, damit die Item- 
anzahl nicht künstlich erhöht oder reduziert werden muss. 

Eine im kleinen Rahmen stattgefundene Pilotierung an der LMU ergab 
gute Ergebnisse v.a. hinsichtlich der Test-Objektivität und Authentizität. Eine 
weitere Validierung wird in Form einer Vergleichsstudie des in Bayern einge- 
setzten Verfahrens durch die Ärztekammer und des SAM von unabhängigen 
Expert*innen in Berlin durchgeführt. 


23 Die Anpassung erfolgt indem „die Punktzahl der sechs Teilstationen durch eine Multiplikation 
mit unterschiedlichen Faktoren so gewichtet werden, dass jeweils 1⁄6 der maximal möglichen 
Gesamtpunktzahl in jeder Teilstation erworben werden kann“ (Lenz et al. 2019: 0.S.). 
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2.2 Analyse und Evaluation 


Der Vergleich und die Analyse der vorgestellten Prüfungen haben gezeigt, 
dass sich alle Formate eng an den GMK-Beschlüssen orientieren. Alle über- 
prüfen fachsprachliche Kenntnisse in mündlicher wie schriftlicher Form und 
weisen die dort geforderten fachspezifischen Kommunikationssituationen auf: 
Es finden ein Arzt*-Patienten*-Gespräch (Anamnese) sowie ein Arzt*-Arzt*- 
Gespräch (Patienten*vorstellung) statt und eine berufstypische schriftliche 
Dokumentation (Arztbrief) wird verlangt. Angesichts des hierfür notwendi- 
gen Sprachniveaus kann von der (theoretischen) Überprüfung der Fachspra- 
chenkenntnisse auf dem geforderten C1-Niveau bei allen gesprochen werden. 
Wie bereits in Kapitel 2.1 in Grundzügen dargestellt, unterscheiden sich die 
Prüfungen nichtsdestotrotz in gewissen Punkten erheblich. Diese möchte ich 
nun im Einzelnen spezifizieren und evaluieren. 


2.2.1 tele Deutsch B2-C1 Medizin Fachsprachpriifung 


Diese Prüfung ist die einzige der FSP, die alle vier Fertigkeiten (Hören, Lesen, 
Schreiben, Sprechen) explizit abprüft. Die Teile ‚Hörverstehen‘ ‚Leseverstehen‘ 
und ‚Sprachbausteine‘ werden in Form einer schriftlichen Gruppenprüfung 
vor der 60-minütigen Einzelprüfung abgelegt. Dieses Format bietet den Vorteil, 
beim Antrag auf Approbation bzw. Berufserlaubnis kein gesondertes B2-Zerti- 
fikat vorlegen zu müssen, da bei dieser Prüfung sowohl allgemeinsprachliche 
Kenntnisse auf B2 als auch Fachsprachenkenntnisse auf C1-Niveau abgeprüft 
werden (vgl. auch Marburger Bund 2018). Dies kommt dem in den GMK-Be- 
schlüssen formulierten Ziel nach, „dass von den Antragstellenden für die Ertei- 
lung der Approbation oder Berufserlaubnis künftig [nicht] verpflichtend zwei 
Sprachtests gefordert werden [sollen]“ (87. GMK 2014: 2). Das Augenmerk 
der Analyse lag auf der Einzelprüfung, die den Inhalten und Zeitvorgaben der 
GMK-Beschlüsse entspricht. Für die Anamnese bekommen die Teilnehmen- 
den fünf Minuten Vorbereitungszeit und zu keinem Zeitpunkt dürfen Hilfs- 
mittel genutzt werden. Für die dort beschriebenen drei Kommunikationssi- 
tuationen kommt bei dieser telc-Prüfung ein Fall zum Einsatz. Das bedeutet 
die Prüfungsteilnehmenden bekommen zur Durchführung aller Teile einen 
Patienten*-Fall, der ein bestimmtes Krankheitsbild mit den entsprechenden 
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Symptomen usw. darstellt. Dieser wird beim Anamnese-Gespräch erhoben, 
dazu der Kurz-Arztbrief verfasst sowie beim Arzt*- Arzt*-Gespräch vorgestellt. 
Diese Vorgehensweise ist in der Hinsicht problematisch, dass dadurch die Be- 
wertungskriterien der Prüfungsbereiche in Abhängigkeit zu einander stehen 
und somit „[d]ie Leistung in einem Bereich [...] nicht mehr ausschließlich von 
der Kompetenz in diesem Bereich ab[hängt], sondern auch von der Leistung in 
bereits durchlaufenen Testabschnitten“ (Moosbrugger & Kelava 2008, zit. nach 
Lenz et al. 2019: 0.S.). Darüber hinaus entsteht dabei das Risiko, je nach Fall 
bzw. dessen Fachgebiet, Prüfungsteilnehmenden durch ihre bisherige berufli- 
che Erfahrung zu bevorteilen bzw. zu benachteiligen. Denn besseres Fachwis- 
sen führt automatisch auch zur besseren Prüfungsleitung, auch wenn bei der 
FSP das medizinische Fachwissen per se nicht zu bewerten gilt. Die Prüfungs- 
fairness könnte somit gefährdet oder zumindest reduziert sein. Die Tatsache, 
dass der schriftliche Teil der Einzelprüfung (Teil 2: Kurz-Arztbrief) im selben 
Raum in Anwesenheit der Prüfenden verfasst wird, könnte zur erhöhten Ner- 
vosität führen. Ein weiterer problematischer Punkt stellt die synchrone Bewer- 
tung der mündlichen Prüfungsleistungen dar. Wie bereits beschrieben, führen 
die Prüfung zwei Prüfer*innen bzw. Ärzt*innen nach vorgegebenen Bewer- 
tungskriterien durch. Die Beteiligung der bewertenden Person am Prüfungs- 
gespräch erschwert dabei jedoch einen objektiven Bewertungsfokus. Ferner 
ist das Gesagte immer flüchtig und eine Wiederholung ist nicht möglich (vgl. 
ebd.). Positiv zu bewerten ist dabei, dass sowohl die/der telc-Prüfende als auch 
die Ärztin/der Arzt eine telc-Lizenzierung benötigen und somit speziell für 
dieses Prüfungsformat geschult worden sind™. Die Bewertungskriterien dieser 
FSP entsprechen denen einer ,4-Fertigkeits-Priifung’, die sowohl sprachliche 
als auch inhaltliche Angemessenheit berücksichtigen und wird dem Format 
somit gerecht. Es kann jedoch gerade bei der mündlichen Prüfung diskutiert 
werden, ob die allgemeine Einteilung bzw. Gewichtung von inhaltlicher Aufga- 
benbewältigung, Aussprache/Intonation, Flüssigkeit, Korrektheit und Wortschatz 
hinsichtlich des Ziels einer berufsspezifischen ‚Sprachhandlungskompetenz‘ 
(vgl. Kapitel 2.1) zulänglich ist. Für die zwei mündlichen Teile der Einzelprü- 
fung (Teil 1 und 3) gibt es drei Bewertungsbereiche, da nach der Fallvorstel- 


24 Zur Problematik dieser Prüfer*qualifizierungen siehe den Beitrag von Grein in diesem Band. 
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lung noch (mindestens drei) fallbezogene Riickfragen seitens der Arztin/des 
Arztes gestellt werden, die mit bewertet werden. Fallbezogene Fragen bergen 
das Risiko, Fachwissen abzufragen und u.U. schlechtere sprachliche Leistungen 
aufgrund fehlender Fachkenntnisse zu erbringen. Insgesamt wird hier jeweils 
zwischen B2 und C1: gut erfüllt oder erfüllt (B1 oder unter B1) entschieden 
(vgl. tele Übungstest 1: 47). Die Prüfer*innen müssen sich nicht auf ein ge- 
meinsames Ergebnis einigen, der gerundete Mittelwert ermittelt das Ender- 
gebnis (vgl. ebd.). Dies erfolgt später durch lizenzierte Bewerter*innen in der 
telc Zentrale und kann bis zur Übermittlung der Ergebnisse bzw. Ausstellung 
des Zertifikats einige Wochen dauern. Dies kann angesichts der Abhängigkeit 
der Ergebnisse für den weiteren Verlauf des Anerkennungsverfahrens sowie 
den damit verbundenen Aufenthaltsstatus (bei Nicht-EU-Staatsbürger*innen) 
nicht unproblematisch sein. 

Neben der hier dargestellten telc Deutsch B2-C1 Medizin Fachsprachprüfung 
werden auch die telc Deutsch B2 Medizin Zugangsprüfung und die skalierte 
Prüfung telc Deutsch B2-C1 Medizin”, angeboten. Es bleibt fraglich, inwiefern 
ein tatsächlicher Bedarf an drei verschiedenen Prüfungsformaten im Bereich 
Medizin notwendig und fachlich nachvollziehbar ist, zumal sie fachbereichs- 
unspezifisch sind. Positiv zu sehen sind die 3.000 telc-Prüfungszentren welt- 
weit”, die ein flexibleres Ablegen der Prüfung ermöglichen, wobei sich die 
Frage stellt, an wie vielen dieser Zentren v.a. im Ausland auch die FSP Medizin 
tatsächlich durchgeführt wird. Außerdem bietet die telc Zentrale in Frankfurt 
a.M. zentrale Prüfungstermine an (wegen Corona vorerst ausgesetzt). Zudem 
steht ein kostenloser Übungstest zum Download zur Verfügung. Dies unter- 
stützt eine gute Vorbereitungsmöglichkeit für die Teilnehmenden und Kurslei- 
tenden und schafft damit Transparenz nicht nur hinsichtlich der Prüfungsteile 
und des Ablaufs, sondern auch der Bewertung(skriterien). Die telc gGmbH als 


25 Skalierte Prüfungen umfassen zwei unterschiedliche GER-Stufen. Die Aufgaben in der Prü- 
fung sind für zwei aufeinanderfolgende Niveaus entwickelt und erlaubt eine Auswertung der 
Sprachkompetenz auf zwei unterschiedlichen GER-Stufen. Für weiterführende Informationen 
zu diesen Prüfungsformaten siehe: https://www.telc.net/pruefungsteilnehmende/sprachprue- 
fungen/filter.html, 30.07.2020. 


26 Für eine Suche bzw. Übersicht der weltweiten telc-Priifungszentren vgl. https://www.telc.net/ 
pruefungsteilnehmende/pruefungszentrum-finden.html, 30.07.2020. 
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etablierter und erfahrener Priifungsanbieter hat sich den ALTE-Standards der 


Testentwicklung verschrieben. Uber statistische Auswertungen, den Teilnah- 


mezahlen, Bestehens- und Durchfallquote gibt es keine zugänglichen Daten. 


Diese FSP wird allerdings nur in drei Bundesländern (Hessen, Saarland, 


Schleswig-Holstein) als erforderlicher Sprachnachweis bei der Approba- 


tions-Beantragung akzeptiert und dürfte daher anderorts bei den Antragsstel- 


lenden kaum sehr attraktiv sein. Diese Regelung fördert ferner die Problematik 


des 0.g. Prüfungstourismus. 


Zusammenfassende Darstellung telc Deutsch B2-C1 Medizin Fachsprachpriifung 


Aufbau: 


B2-Niveau: allgemeinsprachlich, C1-Niveau: fachsprachlich; 
Schriftliche Gruppenprüfung und Einzelprüfung: Anamnese 
- Arztbrief - Fallvorstellung 


Teile + Dauer 


Schriftliche Gruppenprüfung: 80 Min. [HV: 30Min., LV: 
40 Min., Sprachbausteine: 10Min.]; Einzelprüfung: 65 Min.= 
je Teil 20 Min. (+ 5 Min. Vorbereitung) 


Patientenfälle 1 

Bewerter*innen 2: mind. 1 Arztin/Arzt und 1 telc-lizenzierte Prüfer*in beide: 
Priiferlizenz 

Schulung/Lizenz 1-tägige Schulung zum Prüfungsformat durch telc-Refe- 


rent*in 


Gesprächspartner*innen für 


Anamnese Patient*in = prüfende Ärztin/Arzt 
Fallvorstellung Ärztin/Arzt = prüfende Ärztin/Arzt 
Bewertung 
mündlich synchron durch Prüfer*innen, keine Einigung nötig > End- 
note = Mittelwert (durch telc-Zentrale bestimmt) 
schriftlich durch telc-Bewerter*in mit Bewerterlizenz 


Punkte und Kriterien 


mündlich: 15 Punkte - inhaltliche Angemessenheit; 20 
Punkte: sprachliche Angemessenheit sowie Aussprache/Into- 
nation, Flüssigkeit, Korrektheit, und Wortschatz 

Arztbrief: 15 Punkte inhaltliche; Angemessenheit/Aufgaben- 
bewältigung, Kommunikative Gestaltung, Korrektheit und 
Wortschatz 

Verteilung: Schriftliche Gruppenprüfung: 50% - 50% Ein- 
zelprüfung 
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bestanden mit 60% je Teil (mündlich/schriftlich); 
Wiederholung bei Gesamtprüfung, beliebig oft 
Nicht-Bestehen 
Anforderungen Anmeldung und Gebühr 
Material (zur Vorbereitung) | Modelltest inkl. Hördateien, Bewertungsbögen, Ablaufplan 
Konzeption interne Testentwicklung nach ALTE-Standards 
durchgeführt von telc-Zentrale oder lizenziertes Testzentrum 
anerkannt in Hessen, Saarland, Schleswig-Holstein 
Kosten abhängig vom jeweiligen Testzentrum 
digitale Version X 


2.2.2 Ärztliche Fachsprachenprüfung Rheinland-Pfalz 


Diese FSP weist neben den im GMK-Beschluss formulierten inhaltlichen und 
zeitlichen Mindestanforderung auch weitere Prüfungsteile bzw. -abschnitte auf 
(vgl. Kapitel 2.1.2). Es werden gesondert zusätzlich das Hör- und Leseverstehen 
getestet sowie medizinische Fachbegriffe in Form eines Vokabeltests und Be- 
schriftungen eines Körperschemas abgefragt. Von einer umfänglichen ‚4-Fer- 
tigkeiten-Prüfung‘ kann hierbei jedoch nicht gesprochen werden. Seit Juni bzw. 
Juli 2020 existieren aktualisierte Informationen zur FSP in RLP und ein dazu- 
gehöriges Informationsblatt mit , Ablaufhinweisen‘ (vgl. BAK 2020a/b). Daraus 
geht zum einen die Änderung des ersten Teils vom bisherigen ‚Vokabeltest‘ zum 
‚Verständnistest‘ und damit die Erweiterung der Unteraufgabe c) Beschriftun- 
gen einer Schemazeichnung des Körpers hervor. Außerdem wurde als Teil 2 das 
freie Gespräch eingeführt. Die weiteren Teile wurden beibehalten, wobei Teil 
4 und 5 zusammengefügt zu sein scheinen. Innerhalb der Informationsblätter 
herrscht also keine Übereinstimmung der Prüfungsteile und Ausführungen. 
Außerdem sind keine konkreten Erläuterungen oder Anforderungen für Teil 
2 freies Gespräch, bei Teil 3 zur Patienten*aufklärung und zu Anforderung zu 
Untersuchungen zu finden. Laut Aussagen der Prüfungsteilnehmenden handelt 
es sich beim freien Gespräch um eine Vorstellung der eigenen Person. Mit der 
Patienten*aufklärung ist das an das Anamnesegespräch anschließende Infor- 
mieren der Patientin/des Patienten über das weitere Vorgehen bzw. weitere 
Untersuchungen gemeint. Beiletzterem Abschnitt müssen zwei Anforderungs- 
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scheine z.B. für eine Computertomografie (CT) mit fehlendenden Informatio- 
nen wie bspw. den Grund der durchzuführenden Untersuchung in Form eines 
Lückentextes ausgefüllt werden. Diese können allerdings, im Gegensatz zu den 
Ausführungen auf dem Informationsblatt, unabhängig von der durchgeführten 
Anamnese und des vorliegenden Patienten*falls seitens der Prüfenden gewählt 
werden. Dass diese wichtigen Informationen nicht explizit aufgeführt sind, 
zeugt von fehlender Transparenz seitens der Bezirksärztekammer und mindert 
eine gute Vorbereitung. 

Mit dem Einsetzen eines Vokabeltests, wie es bei dieser FSP der Fall ist, 
werden die Leistungen isoliert erfasst, was eine verlässliche und eindeutig 
‚falsch‘ oder ‚richtig‘ zu bewertende Lösung mit sich bringt (vgl. Rossa 2016: 
400). Damit lässt sich zwar eine höhere Reliabilität erzeugen, es fehlt aber die 
Kompetenzorientierung, da die so wichtige Authentizität der Prüfungs- bzw. 
Sprachleistung damit verloren geht. Die Effektivität des isolierten Abfragens 
bzw. ,Ubersetzens‘ von Fachvokabular in Laiensprache und umgekehrt” könnte 
man hinsichtlich des Ziels einer ‚Sprachhandlungskompetenz‘ (vgl. Kapitel 
1.1) im medizinischen Kontext als Prüfungsteil grundsätzlich in Frage stellen, 
zumal diese Kompetenz im Rahmen des Patienten*-/Arzt*-Arzt*-Gesprächs 
überprüft werden kann bzw. wird. Wie bei der telc-Priifung kommt auch hier 
die ,Ein-Fall-Szenario-Methode bei den mündlichen Teilen zum Einsatz. Uber 
die oben genannten Problematiken hinaus, die damit einhergehen, dass sich 
nur ein einziger Patienten*fall über mehrere Prüfungsfälle erstreckt, ist bei 
dieser Methode der Prüfungsverschleiß deutlich höher. Der Austausch eines 
Falls bedeutet automatisch den Austausch des gesamten Tests oder zumindest 
der aufeinander aufbauenden Teile. Die Schwierigkeit des neuen Falls lässt sich 
somit nicht eindeutig vergleichen. Laut Berichten seitens der Prüfungsteil- 
nehmenden sind ca. 22 abwechselnd eingesetzte Krankheits-/Patientenfälle 


27 Das Übersetzen/Dolmetschen (interlinguale Mediation) und das Paraphrasieren in der 
Fremdsprache (intralinguale Mediation) wurden zwar im neuen Begleitband des GER auf- 
genommen, doch entspricht dieser Vokabeltest nicht dem Konzept der Sprachmittlung (vgl. 
Begleitband zum GER: Englische Version abrufbar unter: https://rm.coe.int/cefr-companion- 
volume-with-new-descriptors-2018/1680787989, 11.08.2020; für Deutsch vgl. Quetz, J. & 
Rossa, H. (Hrsg.) (2019): „Der neue Companion Volume to the Common European Frame- 
work of Reference for Languages (Begleitband zum Gemeinsamen europäischen Referenz- 
rahmen für Sprachen)“ in: Zeitschrift für Fremdsprachenforschung 30: 2. 
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bekannt, die anscheinend kürzlich um weitere sieben ergänzt wurden (bspw. 
auch Covid-19). 

Beim Abschnitt zum Leseverstehen sollen zu ärztlichen Befunden bzw. 
einem Entlassungsbrief drei Fragen schriftlich auf dem dafür ausgehändigten 
Vordruck beantwortet werden. In Bezug auf die Höraufgabe in diesem Teil 
herrschen jedoch Unklarheiten: Von zwei Telefonanrufen sollen Informatio- 
nen notiert werden. Dabei ist nicht klar, wer anruft und in welcher Form die 
Dokumentation erfolgen soll. Dass es sich dabei um Anrufe bspw. aus dem 
Labor zur Übermittlung von Patienten*informationen handelt, erfährt man 
nur über die TN. 

Wie in Kapitel 2.1.2 beschrieben, müssen die jeweiligen Teile mit einer 
„ihm zugeordneten“ Mindestpunktzahl abgeschlossen werden. Das Nichter- 
reichen dieser führt zum direkten Abbruch der Prüfung und die weiteren Prü- 
fungsteile werden nicht durchgeführt. Über die erforderlichen Mindestpunkte 
existieren allerdings keine zugänglichen Informationen. Zu den Prüfungsteilen 
heißt es zudem, dass sie in unterschiedlicher Abfolge geprüft werden können 
(BÄK 2020a: 2). Dies erscheint hinsichtlich der ‚Abbruchsregel‘ höchst pro- 
blematisch und kann zu hohem Verlust der Prüfungsfairness führen sowie 
den Fortlauf der Prüfung massiv beeinflussen, zumal die Wertigkeit bzw. die 
Gewichtung der Abschnitte unterschiedlich ist. Die Bewertung findet hierbei, 
wie bei telc, synchron statt. Dazu übernehmen auch hier die Prüfenden gleich- 
zeitig die Rolle der/des Bewertenden und der/des Gesprächspartner*in. Beider 
ärztekammerlichen Prüfung besteht die Prüfungskommission jedoch lediglich 
aus Ärzt*innen. Die Aussage von Dr. Windhorst, Präsident der Ärztekammer 
Westfalen-Lippe, die als unabhängige Prüfungsinstanz die Durchführung der 
FSP für das Land durchführt, untermauert diese Wahl: 


Wer besser als eine Ärztin oder ein Arzt kann beurteilen, ob medizi- 
nisch Sprachinhalte ausreichend sicher verstanden und so weitergege- 
ben werden können, dass Missverständnisse vermieden werden, Patien- 
tinnen und Patient sprachlich empathisch begegnet werden kann und 
ärztliche Kolleginnen und Kollegen aus den Angaben die medizinisch 
richtigen Schlussfolgerungen ziehen können (zit. in: ÄKWL 2019: 0.S.). 
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Dieser Ansicht steht die Forderung gegenüber, angesichts der Komplexität 
der Fachsprachenprüfung beide Fachrichtungen (Medizin und Sprachwissen- 
schaft) zur Bewertung der Prüfungsteilnehmenden heranzuziehen (vgl. Deppe 
et al. 2015: 37 und Kapitel 2.3), zumal nicht bekannt ist, ob die prüfenden 
Ärzt*innen eine Art Prüfungsschulung (in Bezug auf sprachwissenschaftliche 
Kriterien) durchlaufen (müssen). Im Zusammenhang mit einer validen Fach- 
sprachenprüfung spielen unweigerlich die Prüfer*innen, v.a. die die mündli- 
chen Sprachfertigkeiten der Ärztinnen bewerten, eine ausschlaggebende Rolle 
(vgl. Kapitel 2.3). Es stellt sich also die Frage, welche Kompetenzen diese zur 
Abnahme von berufs-/fachspezifischen Prüfungen und zur Bewertung der 
(mündlichen) Sprachkompetenzen benötigen und wie sie diese erlangen. Wie 
bereits beschrieben, erfahren die Prüfungsteilnehmenden direkt im Anschluss 
an die Prüfung über ihr Bestehen und bekommen ggf. ein Dokument zum 
Nachweis ausgehändigt. Im Falle des Nichtbestehens wird keine Bescheinigung 
ausgestellt, was im Rahmen der BAMF-geförderten Maßnahme ‚Spezialmodul: 
Heilberufe‘ insofern problematisch ist, da somit kein Nachweis für die Teil- 
nahme an der FSP vorgelegt werden und sich dies ggf. negativ auf die weitere 
(Kurs)Förderung auswirken kann. 

Zur Vorbereitung auf die Prüfung kann auf der Internetseite der Ärzte- 
kammer der Anamnesebogen, der für die Erhebung in Teil 3 und zur Aus- 
formulierung in Teil 4 bereitgestellt wird, genutzt werden; ein Modelltest der 
vollständigen Prüfung existiert nicht. Die Anfrage seitens eines Kursträgers in 
Mainz, ob die Kursleitungen der BAMF-geförderten ‚Mediziner-Kurse‘ bei der 
FSP in Mainz hospitieren dürften, um im Unterricht eine bessere Prüfungs- 
vorbereitung zu gewährleisten, wurde ohne handfeste Begründung abgelehnt. 
Dies war vor einigen Jahren noch möglich. 

Hinsichtlich der ausführlichen Beschreibungen und Berichte der abgeleg- 
ten Prüfung (z.B. Auflistung aller Fachbegriffe zu Teil 1 oder Darstellung der 
Patient*innen-Anamnese), die im Internet gerne ausgetauscht und zur Verfü- 
gung gestellt werden, kommt die Frage auf, inwiefern die Prüfungsunterlagen 
seitens der TN so im Detail dokumentiert werden können, da sie nicht mitge- 
nommen werden dürfen. Nichtsdestotrotz liefern genau diese Informationen 
mehr Aufschluss über den konkreten Ablauf und geben eine Art ‚Innenansicht‘ 
dieser Prüfung, die sonst hinsichtlich der Konzeption, der Gewichtung und 
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Mindestpunktezahl der Prüfungsteile, der Bewertung(skriterien), der Materi- 
alauswahl und der Prüfer*innenqualifikation bzw. -kommission einige Fragen 
offenlässt. 

Auf dieser Informationsgrundlage lässt sich ein wissenschaftlich fun- 
diertes Konzept dieser Prüfung nur schwer erkennen. Ein umfänglicherer 
Datenzugang bzw. die Auskunft seitens der Bezirksärztekammer ist für eine 
umfassendere und aussagekräftigere Analyse und Beurteilung notwendig. 
Aber genau dieser eher intransparente und unwissenschaftliche ‚Ist-Zustand‘ 
bildet die aktuelle Lage der FSP ab, nicht nur in Rheinland-Pfalz, sondern 
die der meisten Ärztekammern in Deutschland (vgl. bspw. Malakhova & 
Lenz 2018). 


Zusammenfassende Darstellung FSP in RLP 


Aufbau: 5 Teile; können in unterschiedlicher Abfolge geprüft werden, 
bei Nicht-Erreichen der Mindestpunktzahl des jeweiligen 


Teils > sofortiger Abbruch der Prüfung 


Teile + Dauer 1) Verständnistest 2) Freies Gespräch 3) Anamnese/Aufkla- 
rung 4) Kurz-Arztbrief 5) Lesen + Hören und Patientenvor- 
stellung; Teil 3, 4 und 5 (Fallvorstellung): je 20 Min., Rest 


unbekannt > insgesamt 2,5-3 Std. inkl. Wartezeit 


Patientenfälle 1 

Bewerter*innen 2: approbierte Arzt*innen, Teil der Prüfungskommission der 
Ärztekammer 

Schulung/Lizenz Nicht bekannt 


Gesprächspartner*innen für 


Anamnese Patient*in = prüfende Ärztin/Arzt 

Fallvorstellung Ärztin/Arzt = prüfende Ärztin/Arzt 
Bewertung 

mündlich synchron durch Prüfer*innen 

schriftlich synchron durch Prüfer*innen 


Punkte und Kriterien 


e Mindestpunktzahl je Teil (bei Nicht-Erreichen > Ab- 
bruch der Prüfung) 
« unterschiedliche Wertigkeit je Teil, Details unbekannt 


bestanden mit 


Gesamtpunktzahl aus allen Prüfungsteilen: 60% 
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Wiederholung bei Gesamtpriifung, beliebig oft 
Nicht-Bestehen 


Anforderungen Prüfungsantrag: - kurzer Lebenslauf, - Kopie der qualifi- 
zierten Eingangsbestätigung (= Beantragung auf Ertei- 
lung einer Berufserlaubnis/Approbation in RLP) - Kopie 
eines Sprachzertifikates, falls vorhanden: Beleg über ein 
Job-Angebot in Rheinland-Pfalz / über eine laufende oder 
abgeschlossene Hospitation in Rheinland-Pfalz; Gebühr 


Material (zur Vorbereitung) | Ablauf, Hinweise zu Prüfungsteilen, Anamnesebogen (als 


Download) 
Konzeption Nicht bekannt 
durchgeführt von Bezirksärztekammer RLP 
anerkannt in RLP 
Kosten 425€ (Stand 2020) 
digitale Version X 


2.2.3 SAM -Sprachtest für ausländische Mediziner 


Beim SAM handelt es sich um eine reine Fachsprachenprüfung, die ebenfalls 
rezeptive und produktive Sprachleistungen testet. Dies geschieht in reali- 
tätsnahen und authentischen Kommunikationssituationen und schließt als 
einziger Test auch die Überprüfung der (fach)sprachlichen Kompetenzen 
mit Angehörigen anderer Heilberufe mit ein. Dieser Gesprächsbereich ist 
in den GMK-Beschlüssen ebenfalls beschrieben (vgl. 87.GMK 2014: 3) und 
wird im SAM in Form eines Anweisungsgesprächs (Telefonat) mit einem/ 
einer Krankenpfleger*in umgesetzt (vgl. Abb. 2). Dieses sowie die Ergänzung 
eines Aufklarungsgesprachs vor einer Operation und das Verfassen eines 
zweiten Teils des Arztbriefs stellen weitere berufstypische Situationen bei der 
arztlichen Tatigkeit im Krankenhaus oder in einer Klinik dar. Die insgesamt 
sechs unterschiedlichen Teile (mündlich wie schriftlich) decken somit nicht 
nur einen größeren realitätsnahen Umfang ab, sondern ermöglichen auch 
einen geringeren Prüfungsverschleiß. Die voneinander unabhängigen Prü- 
fungsteile erleichtern den Austausch älterer Fallszenarien und ein größerer 
Pool an Prüfungsversionen erhöht die Prüfungssicherheit. Die Vermeidung 
der sonst eingesetzten ‚Ein-Fall-Methode‘ wirkt sich darüber hinaus positiv 
auf die Test-Fairness aus. 
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Die Authentizität der Prüfungssituation spiegelt sich auch in der Zeitvorga- 
be von 10 Minuten pro Station wider. Die sehr kurz erscheinende Prüfungszeit 
entspricht jedoch einer realistischen Abbildung der zeitlichen Ressourcen im 
Arbeitsalltag von Ärzt*innen (vgl. Lenz et al. 2019: o.S.). Für eine Patienten- 
vorstellung gibt es keine 20 Minuten Zeit und muss binnen weniger Minuten 
präzise übermittelt werden. Auch für eine Anamnese kann ein/e (Haus) Arzt*in 
sich nicht so viel Zeit nehmen”*. Diese Kompetenz wird im Beruf auch von 
ausländischen Ärzt*innen verlangt und beim SAM auf diese Weise abgeprüft. 
Die Aufteilung in mehrere, aber dafür kürzere Prüfungsgespräche bzw. -statio- 
nen entspricht dem für die mündlichen Kommunikationssituationen gewählte 
OSCE-Format (vgl. Kapitel 3.1.3). Das Verhalten der Prüfungsteilnehmenden 
kann dadurch insgesamt viermal in unterschiedlichen Kontexten beobachtet 
werden und erhöht somit die Reliabilität. 

Bei der Wahl der Prüfungs- und Bewertungsform als auch bei der Wahl 
der Aufgaben wurde auf wissenschaftliche Kriterien geachtet. Beim VOSCE 
handelt es sich um eine erprobte Methode zur Bewertung kommunikativer 
Fähigkeiten in medizinischen Kontexten. Die Erstellung der Bewertungskri- 
terien, sprich die einzelnen Items der Bewertungsskala sowie die Ausfüh- 
rungen zur Beurteilung der Sprachkompetenz, wurden für jede Teilstation 
auf Basis der Analyse wissenschaftlicher Literatur sowie empirischer Bei- 
spiele entwickelt (vgl. Lenz et al. 2019: 0.S.). Die Bewertung enthält keine 
klassischen Bewertungskategorien, wie sie bspw. bei telc standardmäßig ein- 
gesetzt werden, sondern beurteilen viel mehr die sprachliche Handlungs- 
kompetenz. Neben der Fachsprachlichkeit wird hier insgesamt eine situa- 
tionsangemessene Sprachleistung bewertet, die neben Sozialkompetenzen 
(z.B. Der Arzt/die Ärztin spricht den Patienten/die Patientin respektvoll an.) 
auch interkulturelle Elemente wie ‚mündige/r Patient*in, Begrüßungsfor- 
men und Hörerrückmeldung enthalten. Das Einbeziehen dieser Elemente, 
die nicht im GMK-Beschluss verankert sind, zeugt von der Sinnhaftigkeit 
einer interdisziplinären Konzeption der Prüfung unter Berücksichtigung 
von Sprachwissenschaftler*innen. Die asynchrone Bewertung eines exter- 


28 Lauteiner Statistik werden bei einem Ländervergleich hierfür in Deutschland ca. 7,5 Minuten 
genannt (vgl. Figure 2 in: Irving, G. et al. (2017). 
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nen Bewerter*innen-Teams, das nicht am Prüfungsgespräch selbst beteiligt 
ist, lässt sich v.a. hinsichtlich der Objektivität sehr positiv bewerten. Darüber 
hinaus besteht das Team hierbei immer aus einer Ärztin/einem Arzt und 
einer/einem Sprachwissenschaftler*in mit Deutsch als Fremdsprache-Hin- 
tergrund, wodurch beide vertretenden Fachbereiche einbezogen werden. Die 
Einführung und Etablierung einer standardisierten Bewerter*innenschulung 
ist hierbei stark zu empfehlen, um eine reliable und objektive Bewertung 
gewährleisten zu können (vgl. Kapitel 2.3). Das gleiche gilt bezüglich der für 
die Durchführung eingesetzten Schauspielpatient*innen bzw. Ärzt*innen, 
wobei hier bereits ein ausgebautes Schulungsangebot (z.B. bereits während 
des Medizin-Studiums) existiert und somit auf geschulte und erfahrene Per- 
sonen zurückgegriffen werden kann. Für die Durchführung der einzelnen 
Stationen entsteht aufgrund des Prüfungsformats ein erhöhter Bedarf an 
benötigten Räumlichkeiten. Diese Aspekte werden beim SAM seitens der 
Testentwickler*innen selbst als „Schwäche“ bezeichnet, da für die Prüfungs- 
logistik besonders zu Beginn einige Investitionen (testinterne Aufnahmesoft- 
ware, Schulung der Schauspielpatient*innen und der Bewerter*innenteams) 
geleistet werden müssen. Langfristig „sollten die Stärken des SAM diesen 
Nachteil allerdings mehr als ausgleichen“ (Lenz et al. 2019: 0.S.). Diese FSP 
weist nach der Auswertung der ersten Pilotierung eine vielversprechend hohe 
Test-Objektivität und Skalenvalidität auf, die in authentischen Kommuni- 
kationssituationen fair und objektiv die fachsprachlichen Anforderungen 
auf C1-Niveau überprüft. Eine Pilotierung im großen Umfang und weitere 
Erprobungen sind sicherlich notwendig, nicht zuletzt, um eine gewünschte 
Erhöhung der Reliabilität zu erreichen und sicherstellen zu können. 
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Zusammenfassende Darstellung SAM 


Aufbau: 


6 Stationen nach OSCE-Format, 2 pro GMK-Bereich 


Teile + Dauer 


1) Anamnese 2) OP-Aufklärung 3) Arztbrief: Anamnese 
4) Arztbrief: Verlauf und Prozedere 5) Fallvorstellung 6) 
Telefonat mit Krankenpfleger*in; 4x 10 Min. (mündlich) + 
2 x 20 Min. (schriftlich) = 80 Min. 


Patientenfälle 6, je Station ein anderer 

Bewerter*innen 2:1 Ärztin/Arzt und 1 Sprachwisschenschaftler*in/DaF- 
ler*in 

Schulung/Lizenz Schulung zu fallspezifischen Sprachhandlungen > pro 


Station: Gesprächsanleitungen + Zusatzfragen 


Gesprächspartner*innen für 


Anamnese Patient*in/Pflegekraft = geschulte Schauspieler*in 
Fallvorstellung Arztin/Arzt = externe Ärztin/externer Arzt 
Bewertung 
mündlich asynchrone Bewertung durch Bewerter*innenteam (anhand 
von Videoaufzeichnungen) 
schriftlich asynchrone Bewertung durch Bewerter*innenteam 


Punkte und Kriterien 


« pro Teilstation: Bewertung zwischen 11 und 17 Items 
— Gesamtzahl: 83 Items (nachträgliche Anpassung zur 
Gleichgewichtung) 
Bewertungsskala: je drei Kategorien > Beurteilung: je 
mit trifft eher zu (1 Pkt.) - uneindeutig (0,5 Pkt.) - trifft 
eher nicht zu (0 Pkt.) 

e Beiblatt mit (sprachlichen und inhaltlichen) Ausführun- 
gen der Bewertungskriterien je Station 

« getrennte Bewertung > Einstimmigkeit bei Endergebnis 
(Bestehen oder Nicht-Bestehen) 


bestanden mit 


kumulative Leistung aller sechs Teilbereichen: mind. 60% 


Wiederholung bei 
Nicht-Bestehen 


Noch nicht bekannt 


Anforderungen 


B2-Zertifikat 


Material (zur Vorbereitung) 


noch nicht vollumfänglich verfügbar, Bsp. für Bewertungs- 
bogen und -kriterien, Ausführungen für Bewerter*in- 
nen-Team 


Konzeption 


interdisziplinar: Didaktik und Ausbildungsforschung in der 
Medizin, Deutsch als Fremdsprache, empirische Padagogik 
und pädagogische Psychologie; wissenschaftlich fundiert 
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durchgeführt von in der Etablierungsphase 
anerkannt in in der Etablierungsphase 
Kosten Noch nicht bekannt 
digitale Version in der Planungsphase 
3 Zusammenfassender Vergleich und Diskussion 


Die vorgestellten Priifungsformate stellen alle eine Fachsprachenpriifung nach 
Vorgaben des GMK-Beschlusses dar, die medizinspezifische Sprachkenntnisse 
(auf C1-Niveau) überprüfen. 

Der inhaltliche Fokus aller drei Prüfungen liegt auf der medizinischen 
Kommunikation im Krankenhaus oder in einer Klinik und den dortigen 
Gesprächssituationen bzw. -konstellationen (z.B. Bericht an Stationsärzt*in 
- Oberärzt*in, mit dem Pflegepersonal, OP-Aufklärung). Angesichts des er- 
höhten Mangels an Hausärzt*innen v.a. in ländlichen Regionen (vgl. bspw. 
Lübking 2020 und BPB 2012) werden diese den typischen Kommunikations- 
situationen in einer Praxis nicht gerecht. Lenz argumentiert hingegen, dass in 
einer hausärztlichen Praxis der Kommunikationsumfang eingeschränkter sei, 
meistens würden dort nur Anamnesegespräche geführt, was für eine ärztliche 
FSP unzulänglich wäre (vgl. Interview 2020). Außerdem sollte einerseits ein/e 
approbierte/r Ärztin/Arzt all solche Gesprächssituationen meistern können. 
Andererseits stellt die FSP eine Überprüfung allgemeiner medizinischer Fach- 
sprachenkompetenzen dar, mit deren Nachweis man auch in einem Kran- 
kenhaus in Deutschland tätig werden kann. Eine Anpassung der Kurs- und 
Prüfungsformate ist m.E. hinsichtlich einer allgemeinen Unterscheidung der 
Zielgruppen im Kontext Medizin und der speziellen (Sprach)Bedarfe fachlich 
in Erwägung zu ziehen. Diese Empfehlung wurde sowohl seitens des deutschen 
Klinikpersonals in einer Studie von Soppa (vgl. 2019: 59), als auch seitens von 
Prüfungsteilnehmenden ausgesprochen”. Eine praktische Umsetzung scheint 
aufgrund des hohen (Kosten)Aufwands jedoch kaum realistisch. 


29 Vgl. Umfrage im Beitrag von Jehle in diesem Band. 
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Nennenswerte Unterschiede zwischen den Prüfungen zeichnen sich v.a. 
in den Bereichen Inhalte und Aufbau, Bewertungsform und -kriterien sowie 
Prüfer*innen ab, was unmittelbaren Einfluss auf die testtheoretische Güte (vgl. 
Kapitel 2) der FSP hat. 

Die von den Ärztekammern durchgeführte FSP ist bislang in den meisten 
Bundesländern die einzig anerkannte FSP, daher stellen deren Unterschiede 
Prüfungsteilnehmenden vor unnötige Herausforderungen und ergibt m.E. 
einen umso dringlicheren Bedarf an Einheitlichkeit und Transparenz. Die 
Erfüllung der von der GMK beschlossenen Mindestanforderungen sind hier- 
für jedoch nicht ausreichend: Die Vorgaben zum konkreten Ablauf sind zu 
vage und konkrete Bewertungsrichtlinien sind nicht vorhanden. Dies bietet 
den Ärztekammern noch zu viel Spielraum bei der Durchführung (vgl. auch 
Malakhova & Lenz 2018: 3). Der SAM, den es hier mit etablierten FSP zu 
vergleichen galt, bietet einen guten Ansatz hin zu einem bundeseinheitlichen 
Prüfungssystem, das mit einem wissenschaftlich fundierten Konzept den auf- 
gezeigten Problemen (vgl. Kapitel 2.3) entgegenwirkt. 

Insgesamt kann das Ziel der Repräsentativität und der Möglichkeit einer 
Generalisierung der Ergebnisse auf die Gesamtheit der Prüfungen mithilfe 
dieser Analyse nicht zufriedenstellend realisiert werden. Die Ergebnisse er- 
möglichen jedoch einen Einblick auf die aktuelle Prüfungswelt und können 
so als Basis für weitere Forschungsvorhaben dienen. 

Mit der Einführung eines neuen Prüfungsformats sollte auch eine Anpas- 
sung bzw. Erweiterung der Sprachkurse für Mediziner*innen einhergehen, 
da nur bei bekanntem Testform auch dessen Testgüte greift. Hierbei müsste 
zwischen Kursen zur reinen Testvorbereitung und/oder als Sprachlernangebot 
unterschieden werden. Roche betont, dass gerade berufsspezifische Sprachkur- 
se „[...] stärker als bisher fallbasiert und szenarien-didaktisch arbeiten [soll- 
ten], also stärker die tatsächliche Kommunikation in den Blick nehmen als 
die abstrakten Regeln des Sprachsystems. Auch die Sprachprüfungen müssten 
diese Kompetenzen stärker berücksichtigen“ (2014: 318). Dies entspricht auch 
dem grundsätzlichen Ziel des ‚Masterplan Medizinstudium 2020, mit dem in 


30 Vgl. ‚Masterplan Medizinstudium 20205 abrufbar unter: https://www.bmbf.de/de/masterplan- 
medizinstudium-2020-4024.html, 31.07.2020. 
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der Approbationsverordnung ein starkerer Fokus auf Kommunikationskompe- 
tenzen sowie vermehrt kompetenzorientierte Studieninhalte und (Prüfungs-) 
Aufgaben verankert sind (statt des bisherigen ‚Ankreuzens‘). So wird auch 
bei den in Deutschland ausgebildeten Ärztinnen eine insgesamt praxis- und 
handlungsorientiertere Lehre stattfinden. 

Im Zuge einer solchen Etablierung wäre ebenso eine Weiterbildung der 
KL hinsichtlich der Anforderungs- und Bewertungskriterien des neuen Prü- 
fungsformats ratsam und notwendig, um die internationalen Ärzt*innen best- 
möglich auf die Prüfung vorbereiten zu können. Im Fall des SAM wäre das 
Bereitstellen von Beispielvideos der einzelnen Prüfungsteile inklusive Bewer- 
tungskriterien für KL und TN sehr hilfreich. 

Der Personalmangel im medizinischen Bereich sollte und darf nie zu einem 
Herabsetzen der zur Berufsausübung fachlichen wie sprachlichen Anforderun- 
gen führen, auch nicht zu Berufsbeginn. Berufe, bei denen die Patient*innen- 
sicherheit oberstes Gebot darstellt und die Gesundheit auf dem Spiel stehen 
kann, bergen durchaus beachtliche Risiken. Eine Einheitlichkeit der FSP in 
den Bundesländern bei Durchführung und Bewertung wäre hierfür sehr för- 
derlich. Grundlegend ist darüber hinaus die Einstellung der internationalen 
Ärzt*innen, die sich nicht ausschließlich auf ihre fachlichen Kenntnisse und 
medizinischen Fähigkeiten verlassen dürfen, sondern der Sprache und ihrer 
kompetenten Verwendung (auf allgemein- und fachsprachlicher Ebene) höhe- 
re Wichtigkeit beimessen müssen. Dies ist letztlich für das Bestehen der FSP 
ausschlaggebend. 

Der Blick in die Praxis zeigt, dass die für eine reibungslose Berufsausübung 
erforderlichen (Fach)Sprachkompetenzen trotz bestandener FSP nicht immer 
ausreichend vorhanden sind (vgl. bspw. Studie Soppa 2019) und darüber hi- 
naus weitere Faktoren für den erfolgreichen Arbeitsalltag eine wichtige Rolle 
spielen (vgl. ebd.). Diese komplexen (Sprach)Kompetenzen vermag keine FSP 
in vollem Umfang zu überprüfen, sodass über ein kompetenzerweitertes An- 
erkennungsverfahren bzw. damit verbundene Fördermaßnahmen zu diskutie- 
ren wäre. Neben einer validen FSB, die als Nachweis der für den Berufsalltag 
unabdingbaren (Fach)Sprachkenntnisse gilt, sollten darüber hinaus auch die 
ebenso wichtigen interkulturellen Kompetenzen gefördert werden, zum einen 
durch eine verstärkte Einbindung der Thematik ‚Kultursensible Medizin‘ und 
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‚Interkulturelle Kommunikation‘ im Sprachunterricht. Zum anderen könnte 
bspw. seitens der medizinischen Einrichtung vor Arbeitsbeginn ein Interkul- 
turelles Training für ausländische Ärzt*innen verpflichtend angeboten als auch 
berufsbegleitende (Sprach)Förderangebote etabliert werden. Zusätzlich sollte 
auch das deutsche Klinikpersonal im Rahmen kontinuierlicher Angebote nicht 
nur im Umgang mit Patient*innen mit Migrationshintergrund geschult, son- 
dern auch für die kulturellen und arbeitstechnischen Unterschiede in einem 
internationalen Team sensibilisiert werden. So kann der Berufseinstieg und 
eine langfristige Integration ausländischer Ärzt*innen erleichtert werden. 

Angesichts des großen Bedarfs an Pflegekräften v.a. in der Altenpflege (vgl. 
Augurzky & Kolodziej 2018: 0.S.) ist die Forderung nach einem bundesweit 
einheitlichen Anerkennungsverfahren sowie der fachspezifischen sprachlichen 
Handlungsfähigkeit und deren Nachweis auch auf diesen Bereich übertragbar 
bzw. auf alle (verkammerten und unverkammerten) Heilberufe, wie Zahn- 
arzt*innen und Apotheker*innen. 

Es bleibt also spannend, wie sich die Anerkennungsverfahren bzw. die 
Prüfungslandschaft im Bereich der FSP Medizin sowie der gesamte Inte- 
grationsprozess und die Förderangebote ausländischer Fachkräfte in Zukunft 
entwickeln werden. Bei einem föderalen System wie dem hiesigen, in dem 
immer viel von politischen Entscheidungen abhängt und v.a. in diesem Be- 
reich mitunter auch wirtschaftlich entschieden wird, ist eine flächendeckende 
Einführung einer ‚neuen‘ Prüfung schwer umsetzbar. Nichtsdestotrotz bietet 
der SAM aus dargelegten Gründen die Voraussetzungen dafür, „ein Teil des 
Approbationsverfahrens ausländischer [Ärzt*innen]“ (Lenz et al. 2019: 0.S.) 
zu werden. Dies ist bspw. in Form eines weiteren anerkannten Anbieters (ne- 
ben der FSP der Landesärztekammer) im jeweiligen Bundesland möglich und 
hätte so die Chance auf Etablierung. Doch solange es eine Auswahl an und 
bedeutende Unterschiede der anerkannten Prüfungen gibt sowie seitens der 
Prüfungsteilnehmenden der Weg des geringsten Aufwands und Widerstands 
gewählt wird, stellt sich die Frage, inwieweit der aus Teilnehmendensicht kom- 
plex und umfangreicher scheinende SAM” freiwillig gewählt würde. Geringere 
Gebühren könnten dabei sicherlich einen Anreiz schaffen. 


31 Vgl. Umfrage im Beitrag von Jehle in diesem Band. 
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Eine denkbare digitale Version dieses Prüfungsformats bietet in Zeiten von 
Digitalisierung und Globalisierung - nicht nur angesichts der Corona-Pan- 
demie - weitere Möglichkeiten der weltweiten und v.a. ressourcensparenden 
Prüfungsdurchführung. 


4 Fazit 


Der vorliegende Beitrag sollte zum einen zeigen, ob eine FSP als Nachweis der 
von internationalen Ärzt*innen geforderten Sprachkompetenzen gelten kann, 
zum anderen inwiefern die vorgestellten FSP einen validen Test zur Überprü- 
fung dieser darstellen. Die erste Fragestellung kann hinsichtlich der komplexen 
und vielschichten (sprachlichen) Anforderungen im ärztlichen Tätigkeitsfeld 
mit ,nein’ beantwortet werden. Die beschriebene ‚sprachliche Handlungskom- 
petenz‘ kann im Rahmen einer FSP nicht vollumfänglich überprüft werden, 
v.a. angesichts der derzeitigen Prüfungslandschaft. Voraussetzung für die Aus- 
sagekraft des Nachweises ist eine Standardisierung der Tests und ihrer Be- 
wertung. Hier hat der Vergleich der Prüfungen gezeigt, dass der SAM einen 
wissenschaftlich fundierten Ansatz liefert, der mit seiner Etablierung einen 
Beitrag zur einheitlichen und validen Überprüfung fachspezifischer Sprach- 
kompetenzen leisten könnte. Zudem wurde deutlich, wie sinnvoll und not- 
wendig eine interdisziplinäre Konzeption und Bewertung von FSP sind. Nur 
unter Einbeziehen aller tangierender Fachbereiche ist die Gewährleistung der 
Testgüte und somit eines validen Nachweises möglich. Nicht zuletzt soll dieser 
Beitrag für ein kompetenzorientiertes Anerkennungsverfahren sensibilisieren. 
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Anhang: Prüfungsformat Fachsprachenprüfung Medizin 
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Subtest Ziel Aufgabentyp Zeit Punkte 
© Hörverstehen 
Teil 1 Routinemäßige Situation verstehen 6 Richtig/Falsch- und 
3 Mehrfachwahlaufgaben 
Teil 2 Unterschiedliche Positionen zu 5 Zuordnungsaufgaben 30 Min. 20 
einer Fachthematik erkennen 
2 Teil 3 Fachdiskussion verfolgen 6 Richtig/Falsch-Aufgaben 
3 
T p Leseverstehen 
e 
2 Teil 1 In einem Zeitungsartikel 5 Mehrfachwahlaufgaben 
8 Informationen suchen und zuordnen 
= Teil 2 E-Mails verstehen und Betreffzeilen 3 Zuordnungsaufgaben 
5 zuordnen , 
= Teil 3 Informationstext zu Regel- und Ver- 3 Richtig/Falsch- und 40:Min. 20 
= fahrensabläufen verstehen 3 Mehrfachwahlaufgaben 
re} 
n Teil 4 In einem Internet-Fachforum 6 Zuordnungsaufgaben 
Informationen suchen und zuordnen 
BE Sprachbausteine 
a 
Passende diskurssteuernde Elemente 10 Zuordnungsaufgaben s 
in Routinegesprächen auswählen 10 Min. 10 
Gesamtdauer der Schriftlichen Gruppenprüfung 80 Min. 
Vorbereitung Aufgabenblatt für Teil 1 5 Min. 
= Mündlicher Ausdruck 
Teil 1 Arzt-Patienten-Gesprach Aufgabenblatt 20Min.| 35° 
2 (Information über Patienten) 
3 
2 
2 Schriftlicher Ausdruck 
a 
154 
£ Teil 2 Verfassen eines Kurz-Arztbriefes Anamnesegesprach und -bogen 20 Min. 15 
iu 
= Mündlicher Ausdruck 
P Fallpräsentation/Fallvorstellung Anamnesegespräch und -bogen N ` 
tale Rückfragen zur Präsentation 20 Min. | 35 
Gesamtdauer der Einzelprüfung 65 Min. 
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Einleitung 


Mit der zunehmenden Globalisierung, den Internationalisierungsbestrebun- 
gen und dem ebenfalls ansteigenden Interesse, in Deutschland zu studieren, 
rückt das Thema „Prüfung“ zum Nachweis ausreichender Deutschkenntnisse 
immer mehr ins Zentrum des Interesses (vgl. Fandrych & Müller 2019: 293). 
Roche (2013: 108) macht mit seinem Statement „eine voreilige Diagnose von 
sprachlichen Fertigkeiten ohne die wissenschaftliche Fundierung solcher Tests 
kann verhängnisvoll werden“ deutlich, wie wichtig eine zuverlässige Bewertung 
von sprachlichen Kompetenzen ist. Während bis in die 90er Jahre die PNdS 
(Prüfung zum Nachweis der deutschen Sprachkenntnisse) quasi die einzige 
von Hochschulen durchgeführte Prüfung darstellte und lediglich zwischen 
bestanden und nicht bestanden differenzierte, entwickelten sich in den Fol- 
gejahren die DSH (Deutsche Sprachprüfung für den Hochschulzugang) und 
an den Goethe-Instituten das Große und das Kleine Deutsche Sprachdiplom 
(entwickelt an der LMU München) (vgl. Althaus 2018). 2001 kam der TestDaF 
hinzu (Test Deutsch als Fremdsprache), der sich durch einen hohen Grad an 
Standardisierung und weltweite Verbreitung in lizenzierten Testzentren von 
der DSH abgrenzte und weiterhin abgrenzt. 2004 versuchte die Hochschulrek- 
torenkonferenz (HRK) eine stärkere Vereinheitlichung auch der DSH, 2019 
wurde vom FaDaF und der HRK die DSH-Musterprüfungsordnung (MPO) 
überarbeitet (vgl. DSH RundbriefNo. 6); bereits 2004 wurde jedoch die aus der 
PNdS zunächst übernommene Dichotomie bestanden - nicht-bestanden zu- 
gunsten von abgrenzbaren Stufen abgeschafft (vgl. u.a. Koreik 2005, Demmig 
2012). Im Jahre 2006, vollkommen unabhängig vom Hochschulmarkt, entwi- 
ckelte die telc gGmbH gemeinsam mit dem Goethe-Institut den Deutsch-Test 
für Zuwanderer (DTZ). Telc entwickelte dann zunächst eine C1-Prüfung, die 
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jedoch keine Anerkennung von der HRK und der Kultusministerkonferenz 
(KMK) erhielt. Diese wurde dann variiert als telc C1 Hochschule nach längerem 
Prozess in die Rahmenordnung über Deutsche Sprachprüfungen für das Studi- 
um an deutschen Hochschulen (RO-DT) aufgenommen (vgl. zu den Priifungs- 
formaten und Zulassungsvoraussetzungen Grein 2019; Altmeyer 2018). Die 
Universität Mainz beispielsweise nennt als DSH-2 Aquivalente (Quelle: https:// 
www.studium.uni-mainz.de/dsh-und-dsh-aequivalente/ (19.10. 2020)): 


« das deutsche Abitur 

« das Deutsche Sprachdiplom der Kultusministerkonferenz - Stufe II 
(DSD I) 

das Goethe-Zertifikat C2: Großes Deutsches Sprachdiplom (GDS) 

e das Österreichische Sprachdiplom (OSD) - C1 

der TestDaF mit dem Ergebnis 4 x 4 oder besser 


die Feststellungsprüfung eines deutschen Studienkollegs 

« das Zertifikat telc Deutsch C1 Hochschule ab dem Ergebnis „befriedi- 
gend“. (Hinweis: telc Deutsch C1 ist nicht ausreichend, es muss sich 
um die Hochschulprüfung handeln). 


Ziel des vorliegenden Beitrags ist es nun aber nicht, eine Validierung der ein- 
zelnen Sprachprüfungen vorzunehmen (siehe dazu Kecker 2011; Möhring 
& Bärenfänger 2018 zu Lese- und Wortschatzanforderungen DSH, TestDaF 
und telc C1 Hochschule), sondern zu erheben, welche Voraussetzungen die 
Prüferinnen und Prüfer haben müssen, um Prüfungen abzunehmen. Über 
welche Kompetenzen müssen also die „Prüfenden“ (oder auch Bewertenden) 
verfügen? Wie wird sichergestellt, vor allem im Bereich der mündlichen Prü- 
fungen, dass die Prüfenden eine valide Einstufung vornehmen können? Wie 
erlangt man eine sog. Prüferlizenz? Berücksichtigt werden hier der TestDaF, 
telc C1 Hochschule und die DSH, da diese spezifische Sprachprüfungen für den 
Hochschulzugang anbieten. Nach einer Analyse der vorhandenen Dokumente 
werden Befragungen mit sowohl den Institutionen als auch zugelassenen Prü- 
fenden aller drei Testformate durchgeführt. Nach einem allgemeinen Über- 
blick über die Qualitätssicherung, mit Fokus auf mündliche Prüfungen, werden 
die drei Prüfungen und die Bewerter- oder Prüferqualifizierung skizziert. Es 
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folgt dann die Präsentation einer kleinen qualitativen Studie, in der Prüfer und 
Prüferinnen zu ihrer Qualifizierung befragt werden. Gerade Prüferinnen und 
Prüfer im Bereich der mündlichen Prüfungen müssen qualifiziert ausgebildet 
sein, um sicherzustellen, dass sie die Fähigkeiten der zu Prüfenden auch valide 
überprüfen können. Sie entscheiden mit ihrer Bewertung nicht selten über die 
Zulassung zum Studium. 


1 Qualitätssicherung bei den Prüfenden - 
Sekundärquellen und Beschreibungen 


Trotz intensiver Recherche findet sich wenig Sekundärliteratur zu den 
Anforderungen an die Prüfenden im Bereich mündlicher Sprachkompetenz. 
Lennon (2000: 169) führt die zentralen Kriterien für die Evaluation mündlicher 
Textproduktionen auf. Die einzelnen Bewertungskriterien und auch die Schu- 
lung der Prüfenden werden nicht thematisiert. Hoffmann (2014: 145) fasst zu- 
sammen: „Die Beurteilung mündlicher Leistung erfolgt normalerweise auf drei 
Ebenen, der formalen, der inhaltlichen und der strategischen.“ Formal wird 
Phonetik, Intonation, Flüssigkeit, lexikalische und grammatische Korrekt- 
heit überprüft. Auf der inhaltlichen Ebene wird auf die Eigenständigkeit der 
Sprachproduktion, den Grad der Orientierung an Vorlagen und die Situations- 
und Adressatenangemessenheit der Äußerung geachtet. Der kommunikations- 
strategische Bereich, also der Einsatz von Strategien, wird meines Wissens bei 
mündlichen Prüfungen nicht berücksichtigt. In Anlehnung an Straub (2014) 
werden sieben Kommunikationsstrategien differenziert: Verzögerungsstrate- 
gien (u.a. Themenwechsel, Ignorieren, Füllwörter), Sprachwechselstrategien, 
Erschließungsstrategien (u.a. Zustimmen/Verneinen), Kooperationsstrategien 
(u.a. Bitte um Hilfestellung, Bitte um Wiederholung oder Verdeutlichung, Ver- 
ständniskontrolle), Imitationsstrategien (z.B. Nachahmung), Abrufungsstra- 
tegien (Anwendung von chunks) und nonverbale Strategien (Mimik, Gestik). 
Eva Šrámková (2016: 227) thematisiert konkret die Bewertung mündlicher 
Kompetenzen im universitären Bereich (in Tschechien). Sie (2016: 231) geht 
auch auf die Schulung der Prüfenden ein und formuliert: 
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Das Handbuch zur Entwicklung und Durchführung von Sprachtests. Zur Ver- 
wendung mit dem GER erstellt von ALTE im Auftrag des Europarats/ Abteilung 
für Sprachenpolitik (2012) geht in seinem fünftem Kapitel auch auf den Bereich 
der Bewertung von Prüfungsleistungen ein. Auf S. 49 wird angeführt, dass die 


Die Bewerter nehmen sowohl an den theoretisch als auch praktisch ori- 
entierten methodischen Schulungen und Seminaren teil, die nicht nur 
von den tschechischen, sondern auch von den ausländischen Experten 
durchgeführt werden. Zudem werden einige mündliche Prüfungen auf 
Video aufgezeichnet und im Rahmen der einzelnen Sprachsektionen 
regelmäßige Benchmarking- Treffen organisiert, bei denen die Leistun- 
gen der Studenten analysiert und bewertet werden mit dem Ziel, die 
Qualität der standardisierten Prüfungen unseres Fremdsprachenzent- 
rums weiterhin zu verbessern. 


Bewerter einer Schulung bedürfen. Dazu genauer (2012: 50): 


Bei nicht fest angestellten, jedoch regelmäßig eingesetzten Auswerte- 
rinnen und Auswertern bietet sich ein Beurteilungssystem an, das auf 
Parametern wie Genauigkeit, Reliabilität und Geschwindigkeit basiert. 
Auswerter, die nicht zur Zufriedenheit gearbeitet haben, werden ggf. 
nicht weiter beschäftigt oder neu geschult. Eine solche Schulung kann 
Teil eines Systems sein [...]. Auswerter, die immer wieder eingesetzt 
werden, müssen nicht an jedem Training teilnehmen. Eine Begutach- 
tung ihrer Leistung [...] macht es einfacher zu entscheiden, ob ein Aus- 
werter zu einer Schulung gebeten wird, eine Auffrischung benötigt oder 
ersetzt werden soll. 


Auf S. 52 wird konkret auch auf die Bewerterqualifizierung eingegangen. Dort 
heißt es: 
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Ziel der Schulungen von Bewerterinnen und Bewertern sind einheitliche 
und genaue Bewertungen. Standardisierung bedeutet, dass alle Bewerter 
die angestrebten Standards anwenden. [...] Es kann zudem notwendig 
sein, Bewertern ihre bereits vertrauten Bewertungsraster „abzutrainieren“. 
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Der Qualifizierungsprozess umfasst insgesamt mehrere Schritte von der of- 
fenen Diskussion hin zu unabhängiger Bewertung von Teilnehmerleistungen 
aus dem betreffenden Test: 


e gelenkte Diskussion eines Teilnehmerbeispiels, durch das die Bewer- 
ter/innen die jeweilige Kompetenzstufe verstehen lernen 

e unabhängige Bewertung eines Beispiels, gefolgt von einem Vergleich 
mit der Musterbewertung und Diskussion über die Gründe für ab- 
weichende Bewertungen 

e unabhängige Bewertung mehrerer Beispiele, um zu erkennen, wie 
nah die Bewerter nun den Musterbewertungen kommen. 


Auf S. 56 wird auch konkret auf den Bereich „mündliche Prüfung“ einge- 
gangen und formuliert: „Mündliche Bewertung ist sehr viel schwieriger zu 
kontrollieren, es sei denn, die Leistung wird aufgezeichnet. Hier sollten also 
Bewerterinnen und Bewerter vor der Prüfung besonders gründlich geschult 
und richtig eingeschätzt werden.“ 

Notwendig sind folglich, neben ausgesprochen profunden Kenntnissen des 
GER, eine gründliche Schulung einerseits und andererseits die Digitalisierung 
der mündlichen Prüfung. Vorgeschlagen wird zur Überprüfung der Bewer- 
tungskompetenz neuer Bewerter diesen auch bereits bewertete Prüfungen 
vorzulegen, um derart zu erkennen, ob die Einschätzungen zuverlässig sind. 

Auch der EQUALS-Rahmen (2019) geht auf den Bereich „Bewertung“ 
(S. 24-27) ein und benennt die Kompetenzen, über die ein Prüfender verfügen 
sollte. Dazu gehören u.a. Kenntnisse 


« der Grundprinzipien von und der Unterschiede zwischen Bewerten, 
Beurteilen und Prüfen 

« der Unterschiede zwischen formativer, summativer und diagnosti- 
scher Beurteilung, und wo welche Art am besten eingesetzt wird 

e der möglichen Zusammenhänge zwischen Lehr-/Lern- und Be- 
urteilungsverfahren 

« der Grundlagen, des Aufbaus und Klassifizierungssystems des GER 
sowie deren Bedeutung für und Auswirkungen auf die Beurteilung 
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« der Schlüsselkriterien für die Gestaltung von Sprachprüfungen, Beur- 
teilungen und Bewertungen sowie deren entsprechende Anwendung 

e der unterschiedlichen Arten des Lernens, die den verschiedenen 
GER-Niveaustufen entsprechen, wie zum Beispiel vermehrtes Au- 
genmerk auf kognitive Fertigkeiten ab Niveau B2, und entsprechende 
Auswirkungen auf die Beurteilung 

e der Grundsätze und Durchführungsmöglichkeiten von formativer 
Beurteilung 

e der differenzierteren Unterschiede bei den GER-Plus-Niveaustufen, 
zum Beispiel zwischen der B1+ Kompetenz im Vergleich zu Bl und 
B2 

e der Prüfungsarten und Beurteilungstechniken in Bezug auf ihre Re- 
liabilität (Zuverlässigkeit) und Validität (Gültigkeit) für den vorge- 
sehenen Zweck, High oder Low Stakes usw. 

e des Konzepts der Validität und der Unterschiede zwischen verschie- 
denen Arten der Validität sowie deren Auswirkungen auf Prüfungs- 
gestaltung und -durchführung. 


Wissenschaftliche Publikationen im Bereich der Prüferqualifizierung sind rar. 
Zurückgegriffen werden muss daher im Folgenden auch auf Darstellungen 
auf Homepages, z.B. zu den einzelnen Qualifizierungen und veröffentlichten 
Stellenanzeigen, die die Voraussetzungen für die Tätigkeit als „Beurteiler/in“ 
aufführen und, sofern vorhanden, Beurteiler-Handbücher. Sehr präzise werden 
die Voraussetzungen für die Abnahme von Sprachprüfungen beim Luftfahrt 
Bundesamt (2019) formuliert. Hier liegen „Leitlinien für den Erwerb und 
den Erhalt einer Befähigung zur Abnahme von Sprachprüfungen gem. $ 125 
LuftPersV“ vor. Neben Schulungsmaßnahmen wird hier ein abgeschlossenes 
sprachliches Studium gefordert. Die Schulungsmaßnahmen umfassen Kennt- 
nisse der Rating Skalen, drei Bewertungen von Audioaufnahmen, Übungen 
zum Notizenerstellen; Übung zum Erkennen sprachlicher Defizite, eine Ein- 
heit zu administrativen und rechtlichen Aspekten der Prüfertätigkeit und eine 
Schulung zum Prüferverhalten. 

Im Folgenden werden die Informationen zu den Prüferqualifizierungen für 
die Prüfungen, die zu einem Studium an einer deutschen Hochschule berech- 
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tigen, dargestellt: der TestDaF, die telc C1 Hochschul-Prüfung und die DSH. 
Das Goethe-Institut fordert seit 2015 ein Prüferzertifikat, auf das hier nicht 
eingegangen wird, da die Prüfungen des Goethe-Instituts nicht spezifisch auf 
den Zugang zu einer Universität ausgerichtet sind. 


1.1 TestDaF (https://www.testdaf.de) 


Der TestDaF wird in 96 Ländern an lizenzierten, d.h. offiziell zugelassenen 
Testzentren angeboten. Die Prüfung wird vom TestDaF-Institut in Bochum 
nach strengen Qualitätsstandards zentral entwickelt und ausgewertet. Die 
Prüfungsleistungen werden von Beurteilerinnen und Beurteilern bewertet. 
Die Evaluation von Norris & Drackert (2017) bestätigt die hohen Qualitäts- 
standards. Es liegt ein umfangreiches, immer wieder aktualisiertes Test-DaF 
Handbuch für Testzentren vor (aktuell Stand 2018). Hier findet sich auch ein 
Abschnitt „Ihre Verantwortung als Prüfungsbeauftragter“ (S. 16ff.). Das Schu- 
lungskonzept besteht aus dem genannten Handbuch, Präsenzseminaren für 
Prüfungsbeauftragte, sog. E-Modulen, und Webinaren. E-Module sind dabei 
Präsentationen, die einen Einstieg bieten; die Webinare (virtuelle Sitzungen) 
dienen vor allem dem Austausch zwischen den Mitarbeiterinnen und Mitar- 
beiter des TestDaF-Instituts und den Prüfenden sowie den Prüfenden unterein- 
ander. Ende Oktober 2020 erfolgte zudem die erste weltweite Online-Prüfung. 

Der Test besteht aus vier Prüfungsteilen, die einen Bezug zum Hochschul- 
kontext haben und dabei nicht fachspezifisch ausgerichtet sind. Im Bereich 
Leseverstehen (60 Minuten) werden drei Lesetexte mit 30 Items verwendet; 
Hörverstehen (40 Minuten) besteht ebenfalls aus drei Hörtexten mit 25 Items; 
schriftlicher Ausdruck (60 Minuten) beinhaltet eine Aufgabe zum Schreiben, 
und der für diese Studie herangezogene Bereich der mündlichen Prüfung 
(„mündlicher Ausdruck“; 35 Minuten) besteht aus insgesamt sieben Sprech- 
aufgaben. Hier sollen die Teilnehmenden zeigen, dass sie in verschiedenen 
Situationen an der Hochschule sprachlich handeln können. Dies umfasst z.B. 
Gespräche unter Studierenden, Beschreibungen, Stellungnahmen oder Hy- 
pothesenbildungen. Die mündlichen Textproduktionen werden dabei digita- 
lisiert, so dass eine Überprüfung zeitlich flexibel wiederholt werden kann. In 
der online-Version sind leichte Veränderungen geplant. 
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Für die Beurteilenden liegt ein ausführliches Beurteilungshandbuch vor 
(hier: Beurteilungshandbuch. Hinweise fiir Beurteilerinnen und Beurteiler zur 
Bewertung der produktiven Priifungsteile beim TestDaF 2015). Im Gegensatz 
zu den mündlichen Prüfungen von telc und der DSH kommt das Format des 
Simulated Oral Proficiency Interviews (SOPI) zum Einsatz, d.h., dass die Aufga- 
ben digital abgespielt und die mündlichen Beiträge des Prüflings aufgezeichnet 
werden. Kritisiert wird hier zuweilen, dass dies „monologisch“ sei, da kein 
authentischer Dialog stattfindet und dies für den „ungewohnten“ Prüfling 
schwierig sein könne (vgl. z.B. Stevener 2018: 33). Aufgewogen wird diese 
Kritik jedoch durch die Digitalisierung der Sprachproduktionen, die eine 
Überprüfung der Einschätzung von Prüfenden ermöglicht, und die konkrete 
Aufforderung an die Prüfenden, diese Situation zu berücksichtigen (siehe Be- 
urteilungshandbuch 2015: 25, 27). 

Die mündliche Prüfung wird dabei nach drei Kriterien beurteilt: 


1. Wie wirkt die Äußerung als Ganzes auf eine Hörerin oder einen Hörer? 
(Gesamteindruck) 
e Sprechen Sie flüssig, klar, verständlich? 
e Machen Aussprache und/oder Intonation das Verstehen leicht oder 
schwer? 
e Sind Aufbau und Struktur der Äußerung klar zu erkennen? Kann 
man dem Gedankengang gut folgen? 


2. Erfüllt die Antwort die Aufgabenstellung? (Umsetzung der Aufgabe) 
e Bezieht sich die Äußerung auf das gestellte Thema? 
e Werden alle Punkte der Aufgabe ausreichend berücksichtigt? 
e Passt die Äußerung und passen die einzelnen Sprechhandlungen zu 
der Aufgabe und der Situation? 


3. Mit welchen sprachlichen Mitteln wird die Aufgabe gelöst? (Sprachliche 
Realisierung) 
e Ist die Äußerung (Register, Aufbau, Anfang und Ende der Äußerung) 
der Situation angemessen? 
e Wie differenziert und angemessen sind Wortschatz und Syntax? 
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e Erschweren Fehler das Verstehen, oder kann man trotz Fehlern die 
Äußerung gut verstehen? 


Es liegt mit dem Beurteilungshandbuch ein genaues Beurteilungsraster für die 
drei Bereiche vor. Die Prüfenden sind ferner dazu angehalten ihre Einstufungen 
auf dem Bewertungsbogen kurz zu kommentieren. Vor jeder Prüfung erhalten 
die Prüfenden sogenannte Kalibrierungsunterlagen. Diese bestehen aus einem 
Erwartungshorizont (also welche Leistungen werden erwartet), konkreten Bei- 
spielen aus der Erprobungsphase (digital) und eine begründete Beurteilung 
dieser Leistungen von einer Expertenrunde. Die Prüfenden werden folglich 
vor jeder Prüfung spezifisch auf diese Prüfung und die erwartbaren Lösungen 
vorbereitet. Vorgeschlagen wird dabei zunächst eine Einstufung der Prüfungs- 
leistungen durch die Prüfenden selbst, die dann mit der Expertenbewertung 
abgeglichen wird. Der Bewertungsprozess ist folglich stark standardisiert. Bei 
der abschließenden Einstufung werden verzerrende Faktoren (Tendenzen zur 
Strenge bzw. Milde und Zentraltendenz, Positionseffekt, Halo-Effekt, Konta- 
minationseffekt und Persönlichkeits- und Situationsfaktoren) berücksichtigt. 
Ausgewertet wird mit dem Verfahren der Multifacetten-Rasch-Analyse (vgl. 
dazu die Publikationen von Eckes). 

Der/die Prüfende (Beurteilende) muss über ein einschlägiges Hochschul- 
studium, Erfahrungen in der Durchführung von Sprachprüfungen verfügen 
und Deutschkenntnisse mindestens auf C1-Niveau vorweisen. Im Jahresbe- 
richt 2016/17 S. 43ff. wird konkret auf die Schwierigkeiten bei der Beurteilung 
miindlicher Prüfungsleistungen und die Notwendigkeit von Beurteilungskrite- 
rien eingegangen. Empirisch untersucht wird auch der sog. Rater-Ratee Effekt, 
also die Tendenz der Urteilsverzerrung abhängig von der Position des Beurtei- 
lers zu der zu beurteilendenden Person. Insgesamt zeichnet sich der TestDaF 
durch wissenschaftliche Studien zur Qualitätssicherung und -entwicklung aus, 
die sich durch die enge Zusammenarbeit mit der Ruhr-Universität Bochum er- 
klären lassen. Prüfende oder nach TestDaF-Terminologie Prüfungsbeauftragte 
werden in Seminaren geschult bzw. haben in Seminaren auch die Gelegenheit 
zum Austausch mit Kollegen. Konkret implementiert ist für Prüfende das „Se- 
minar für Prüfungsbeauftragte“; daneben werden meist 2-tägige Workshops, 
aber auch kürzere Webinare, zur Fortbildung, ebenfalls für die Prüfenden, 
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angeboten. Themen sind hier - wie zu erwarten - Testen und Evaluieren und 
Leistungsbeurteilung. Eines der häufiger angebotenen Workshops/Webinare 
trägt dabei den Titel „Mündliche Leistungen im TestDaF beurteilen“. 

In einer Stellenanzeige 2020 werden für die Stelle eines Prüfungsbeauftrag- 
ten u.a. folgende Voraussetzungen formuliert: 


e eineinschlägiger Studienabschluss, z. B. Magister, Master oder Staats- 
examen (Sek II) in DaF, Germanistik oder einer modernen Fremd- 
sprache 

e zwei bis drei Jahre Lehrerfahrung in DaF auf den GER-Niveaus B2 
und C1 sowie Erfahrungen im Umgang mit der Zielgruppe des Test- 
DaF, ausländischen Studienbewerberinnen und -bewerbern 

e idealerweise Erfahrungen mit standardisierten Sprachprüfungen (als 
Prüferin/Prüfer oder Beurteilerin/Beurteiler) 

e Bereitschaft zur Teilnahme an Schulungen des TestDaF-Instituts für 
Beurteilerinnen und Beurteiler. 


Bereits 2003 zeigte Eckes (2003: 50), dass bei den Rasch-Modellen zur 
Qualitätssicherung im Rahmen von TestDaF-Erprobungsprüfungen auch eine 
Beurteilerschulung inkludiert ist, die Prüfenden also gezielt geschult werden. 
Kecker (2016: 155), Mitarbeiterin des TestDaF-Instituts, wird konkreter und 
schreibt zu den Prüfenden: 


Der mit der Prüfungsdurchführung betraute verantwortliche Prüfungs- 
beauftragte muss bestimmte Voraussetzungen hinsichtlich seiner Qua- 
lifikation erfüllen und die in einem Handbuch beschriebenen Sicher- 
heits- und Durchführungsbestimmungen beachten. Diese werden in 
Schulungsseminaren (virtuell oder Präsenzveranstaltung) erläutert, zu 
denen Prüfungsbeauftragte regelmäßig eingeladen werden. Die Ein- 
haltung der Vorgaben wird durch unangekündigte Inspektionsbesuche 
am Prüfungstag kontrolliert. 


Direkt zur Bewertung der mündlichen Produktionen formuliert Kecker (2016: 
156): 
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Für die Bewertung der produktiven Leistungen im TestDaF wird im 
TestDaF Institut jeweils ein Beurteiler eingesetzt. Die Beurteiler müssen 
über eine entsprechende Lehrerfahrung mit der Zielgruppe verfügen 
und vor dem ersten Einsatz ein Schulungsseminar absolviert haben. 
Zusätzlich müssen sie jedes Jahr an einer weiteren Schulung teilneh- 
men, die dazu dient, eine einheitliche Anwendung der Bewertungskri- 
terien aufrechtzuerhalten. Zu diesem Zweck werden detaillierte Hand- 
reichungen zum Bewertungsverfahren und Musterbewertungen, sog. 
Benchmarks, verwendet (vgl. Arras 2007). Darüber hinaus werden zu 
jedem Testlauf ein Erwartungshorizont und Benchmarks an die Beur- 


teilergruppe verschickt. 


Den Dokumenten ist zu entnehmen, dass beim TestDaF sehr viel Wert auf die 
Kompetenzen der Prüfenden gelegt wird. 


1.2 Telc (The European Language Certificates) 
https://www.telc.net/ 


Die telc gGmbH bietet tiber 90 standardisierte Priifungen in insgesamt zehn 
Sprachen an. Dabei verfügt telc über 20.000 lizenzierte Prüferinnen und Prüfer 
weltweit. Sie ist ein Tochterunternehmen des Deutschen Volkshochschul-Ver- 
bands e.V. Die Prüfung telc Deutsch C1 Hochschule prüft hochschulbezogene 
Deutschkenntnisse. Insgesamt werden hier vier bzw. fünf Prüfungsteile ange- 
boten: Leseverstehen, inklusive Sprachbausteine (90 Minuten), Hörverstehen 
(40 Minuten), schriftlicher Ausdruck (70 Minuten) und mündlicher Ausdruck 
(als Gruppenprüfung, je nachdem ob zwei oder drei Teilnehmende 16 oder 24 
Minuten plus Vorbereitungszeit). Im ersten Teil halten sich die TN gegenseitig 
eine Präsentation zu einem vorgegebenen Thema. Jeweils im Anschluss müssen 
die Präsentationen der anderen zusammengefasst und kommentiert werden. 
Dabei sollen auch Fragen formuliert und diskutiert werden. Im zweiten Teil 
erfolgt eine Diskussion, wobei Wert auf eine nachvollziehbare Argumentation 
gelegt wird. Die Beurteilung erfolgt nach den Kriterien Aufgabengerechtheit, 
Flüssigkeit, Repertoire, grammatische Richtigkeit und Aussprache und Into- 
nation. Inhaltliche Angemessenheit wird für jeden Teil getrennt bewertet, die 
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anderen Kriterien für die Prüfung insgesamt. Ein genaues Bewertungsschema 
liegt dabei vor (Bewertungsbogen M10) (vgl. Handbuch Deutsch Hochschule 
C1 2014). Ein konkreter Lizenzierungskurs für C1 Hochschule stand nicht 
zur Verfügung. 

Zeidler (2016: 206) schreibt im gleichen Band wie Kecker über allgemeine 
Schwierigkeiten bei der Bewertung von Prüfungen, bezieht sich jedoch auf 
schriftliche Textproduktionen. Vorgestellt wird (2016: 208) das sog. Projekt 
»Bewerterkalibrierung*, welches sich jedoch ebenfalls auf schriftliche Text- 
produktionen bezieht. telc differenziert allgemein zwischen Prüfenden und 
Bewertenden. Beide müssen eine telc-Qualifizierung durchlaufen und erhal- 
ten nach der Teilnahme eine telc-Prüfer- bzw. Bewerterlizenz. Bewertende 
bewerten die schriftlichen Leistungen, Prüfende die mündlichen Leistungen. 
Beide müssen vor der eigentlichen Qualifizierung an dem Online-Modul „Al 
bis C2 Einführung für Prüfende“ teilnehmen. Diesen Teil der Prüfung haben 
die Interviewten nicht absolvieren müssen, da alle bereits Prüferlizenzen für 
andere Niveaus besitzen, so dass dieser Teil offensichtlich neueren Datums 
ist. Für die vorgeschaltete Qualifizierung meldet man sich bei telc Campus 
(https://campus.telc. net/?lang=de) an. Angeboten wird dann ein Moodle- 
Kurs, der laut Internet in drei bis vier Stunden absolviert werden kann. 
Überprüft werden die Voraussetzungen, also die Inhalte des Moodle-Kurses, 
mithilfe eines Quiz. Das Quiz beinhaltet 51 Fragen. Das Quiz besteht aus 
sehr vielen telc-spezifischen Fragen (über 30 Fragen), aber auch einigen spe- 
zifischen Fragen z.B. zu Einschätzungen anhand der Skalen des GER. Nach 
erfolgreichem Abschluss des Quiz erhält man eine E-Mail: 


Vielen Dank für die Abgabe Ihrer Antworten zu ‚Vorbereitung zur Prü- 

ferqualifizierung‘ im Kurs ‚Al bis C2 Einführung für Prüfende‘ am Mitt- 
woch, 19. Februar 2020, 21:47. Gesamtfeedback: Sie sind sehr gut auf Ihre 
Prüferqualifizierung vorbereitet. Wir wünschen Ihnen einen spannenden 
Austausch mit den anderen Prüferinnen und Prüfern und wünschen eine 
erfolgreiche Teilnahme. 


Die anschließende Qualifizierung dauert acht Stunden und die Teilnehmer- 
zahl ist auf 16 Personen beschränkt. Eine Online-Qualifizierung als Auffri- 
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schung ist möglich. Besitzt man bspw. eine Prüferqualifizierung für das Ni- 
veau B1-B2, die im Rahmen einer Präsenzveranstaltung erworben wurde, ist 
eine reine Online-Qualifizierung für eine C1 Prüfung ebenfalls möglich. Alle 
Qualifizierungen sind dabei kostenpflichtig. Die Prüferlizenz erhält man, 
wenn man alle Teilnahmevoraussetzungen erfüllt, sich aktiv am Workshop 
beteiligt und die mündlichen Leistungen anhand von Videoaufzeichnun- 
gen von Prüfungsteilnehmenden „angemessen“ bewertet, also der richtigen 
GER-Stufe zuordnet. Die Lizenz ist drei Jahre gültig. Bei der Prasenz-Quali- 
fizierung erhält man die Handreichung Prüferqualifizierung Deutsch C1-C2. 
Diese beginnt zunächst mit einer Einführung in den GER und der Darstel- 
lung der Struktur der mündlichen Prüfung und den Bewertungskriterien für 
die mündliche Prüfung: Ausdrucksfähigkeit, Aufgabenbewältigung, formale 
Richtigkeit und Aussprache und Intonation. Eingegangen wird knapp auf 
das Prüferverhalten, und es werden sehr allgemeine Tipps formuliert. Fer- 
ner enthält die Handreichung zahlreiche Übungstests. Anhand der bereits 
erwähnten Videos und ausgeteilten Bewertungsbögen werden Einstufungen 
vorgenommen. 

In den Allgemeinen Geschäftsbedingungen und der Prüfungsordnung 
der telc gGmbH werden die Prüfungszentren und die Notwendigkeit eines 
Prüfungsverantwortlichen genannt: „Prüfungsverantwortliche müssen mit 
dem System der telc Prüfungen, einschließlich der Prüfungsordnung und der 
Richtlinien zur Durchführung der Prüfung, vertraut sein“ (S.10). Die Voraus- 
setzungen für die Prüferlizenz sind Unterrichtserfahrung auf den entsprechen- 
den GER-Stufen von mindestens 450 Unterrichtseinheiten, Vertrautheit mit 
den Kompetenzstufen des GER sowie mit dem handlungsorientierten, kom- 
munikativen Ansatz für Unterricht und Leistungsmessung, Sprachkenntnisse 
mindestens auf Niveau C1, Kenntnisse der telc Prüfungsformate und der telc 
Prüfungsordnung. Eine DaF/DaZ-Qualifikation oder ein abgeschlossenes Stu- 
dium ist keine Voraussetzung (vgl. Allgemeine Geschäftsbedingungen und 
Prüfungsordnung der telc gGmbH S.18). 

Eine Digitalisierung der mündlichen Prüfung findet nicht statt. Eine Sen- 
sibilisierung für verzerrende Effekte bei mündlichen Prüfungen erfolgt nicht. 
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1.3 DSH (Deutsche Sprachpriifung fiir den Hochschulzugang) 


Auch die DSH ist bei der HRK und dem FaDaF gemäß § 3 Abs. 1 i.V. mit 
Abs. 6 der ,,Rahmenordnung tiber Deutsche Sprachpriifungen fiir das Studium 
an Hochschulen“ (RO-DT) registriert. Sie wird von jeder Hochschule (wobei 
einige Hochschulen die DSH abgeschafft haben) intern angeboten und ist nicht 
standardisiert. Es gibt zwar ein DSH-Handbuch und auch Vorbereitungsbü- 
cher auf die DSH-Prüfung, aber die Universitäten halten sich unterschiedlich 
streng an die Vorgaben. Schneider (2010) skizzierte bereits vor 10 Jahren die 
Bemühungen um die Standardisierung der DSH-Prüfung. Wollert & Zschill 
(2017) überprüfen, ob die DSH tatsächlich die Studierfähigkeit testet, gehen 
dabei aber weder gezielt auf den Bereich „Mündlichkeit“ noch auf die Prüfer- 
qualifizierung ein. 2019 wurde der Passus zur Prüferqualifikation präzisiert: 
Präzisierung $6(2): Aus der Formulierung zur DSH-Prüfungskommission wird 
eindeutig hervorgehen, dass alle Mitglieder der Kommission für DaF quali- 
fiziert sein müssen. Dies war auch vor der Novellierung schon so intendiert, 
jedoch nicht in dieser Deutlichkeit formuliert (vgl. FaDaF Rundbrief 6, 2019). 

Hier herangezogen wird die DSH der Universität Mainz. Sie gliedert sich in 
einen schriftlichen und einen kurzen mündlichen Teil. Das Internationale Stu- 
dien- und Sprachenkolleg (ISSK) Mainz hat ein Mitglied im sog. DSH-Quali- 
tätszirkel, der sich für die Einhaltung von Qualitätsstandards der DSH einsetzt. 

Die Daten zur DSH an der Universität Mainz (ISSK) werden der Homepage 
entnommen: https://www.studium.uni-mainz.de/dsh-und-dsh-aequivalente/ 
[Letzter Zugriff 19.10.2020]. Die Anforderungen werden auch festgehalten in 
der Ordnung für die Deutsche Sprachprüfung für den Hochschulzugang (DSH) 
an der Johannes Gutenberg-Universität Mainz vom 4. Februar 2013, zuletzt 
geändert am 27. Mai 2019. 

Die schriftliche Prüfung dauert ca. vier Stunden und gliedert sich in vier 
Aufgabenbereiche: Hörverstehen, Leseverstehen und wissenschaftssprachliche 
Strukturen, Textproduktion sowie mündlicher Ausdruck. 

Die schriftliche Prüfung umfasst die Teilprüfungen: 
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1. Verstehen und Verarbeiten eines Lesetextes und wissenschafts- 
sprachlicher Strukturen (Bearbeitungszeit: 90 Minuten einschließ- 
lich Lesezeit) 

2. Verstehen und Verarbeiten eines Hörtextes (Bearbeitungszeit: 10 Mi- 
nuten nach dem 1. Vortrag und 40 Minuten nach dem 2. Vortrag) 

3. Vorgabenorientierte Textproduktion (Bearbeitungszeit: 70 Minu- 
ten) 


Genauer betrachten wir die Angaben zur mündlichen Prüfung. 

Mit der Prüfung soll die Fähigkeit gezeigt werden, studienrelevante sprach- 
liche Handlungen (Erörtern, Bewerten, Exemplifizieren, Informieren, etc.) 
spontan, fließend und angemessen auszuführen und zu rezipieren sowie mit 
relevanten Interaktionsstrategien (Sprecherwechsel, Kooperieren, um Klärung 


bitten, etc.) umzugehen. 


a) Aufgabenstellung und Durchführung 

Die Dauer des Prüfungsgesprächs soll 20 Minuten nicht überschreiten. Die 
mündliche Prüfung besteht aus einem Kurzvortrag möglichst beschreibender 
Art von maximal fünf Minuten und einem Gespräch von maximal 15 Minu- 
ten. Grundlage der mündlichen Prüfung sollte ein kurzer, nicht zu komplexer 
und sprachlich nicht zu schwieriger Text und/oder Schaubild/Grafik sein. Zur 
Vorbereitung des Kurzvortrags soll eine Vorbereitungszeit von maximal 20 Mi- 
nuten gewährt werden. Gruppenprüfungen sind nicht zulässig. 


b) Bewertung 

Die Leistung ist zu bewerten nach der inhaltlichen Angemessenheit, Verständ- 
lichkeit und Selbstständigkeit der Aussagen, dem Gesprächsverhalten, der 
sprachlichen Korrektheit und lexikalischen Differenziertheit, der Aussprache 
und Intonation. 

In der mündlichen Prüfung soll die Kandidatin/der Kandidat beweisen, 
dass sie/er imstande ist, mit Verständnis und Selbstständigkeit Vorgänge, Sach- 
verhalte und Gedankenzusammenhänge zu erfassen, sich sprachlich damit 
auseinanderzusetzen sowie im Gespräch angemessen darauf zu reagieren. Die 
mündliche Prüfung erfolgt in Form eines Prüfungsgesprächs zu Fragen der 
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gewahlten Studienrichtung. Dem Priifungsgesprach kann ein entsprechender 
Text zugrunde gelegt werden. Ein Bewertungsraster liegt vor. Die Bewertung 
wird in der Prüfungsordnung in $5 geregelt; die Prüfer in $6. 

Dem Prüfungsausschuss DSH gehören eine Vorsitzende oder ein Vorsit- 
zender sowie zwei Stellvertreterinnen oder Stellvertreter an, die alle drei für 
den Bereich Deutsch als Fremdsprache qualifizierte hauptamtliche Mitarbei- 
terinnen oder Mitarbeiter des ISSK sind. Prüferinnen und Prüfer sind haupt- 
und nebenamtliche Lehrkräfte des Lehrgebiets Deutsch als Fremdsprache. 

Über jede mündliche Prüfung wird eine Niederschrift angefertigt. Die 
Niederschrift muss die Namen der Mitglieder der Prüfungskommission, 
der oder des Protokollführenden und des Prüflings, Beginn und Ende der 
Prüfung, die wesentlichen Gegenstände der mündlichen Prüfung, die Prü- 
fungsleistungen und das Ergebnis beinhalten. Eine Digitalisierung der Prü- 
fung findet aktuell nicht statt, ist aber laut FaDaF Rundbrief vom 30.06. in 
Planung. 

Über eine etwaige Prüferqualifizierung finden sich keine Informationen. 
Auch Absolventen des Masterstudiengangs DaF/DaZ in Mainz haben zwar ein 
Seminar zu „Prüfen und Testen“ absolviert, sind damit aber sicherlich nicht 
ausreichend auf die Bewertung mündlicher Leistungen vorbereitet. Der GER, 
inkl. dem Begleitband zum GER (2018), sind ihnen dagegen bekannt. Sie kön- 
nen also eine Einstufung nach den Stufen des GER vornehmen. 

Es gilt demnach zu erfragen, wer die mündlichen Prüfungen abnimmt und 
ob diese, wie seit 2019 gefordert, DaF-qualifiziert sind. 
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1.4 _ Tabellarische Zusammenfassung und Entwicklung 
der Leitfragen 
TestDaF telc C1 Hochschule DSH 
Studium sprachlicher Hoch- keine Angaben DaF oder DaZ-Studium 
schulabschluss (DaF, oder 
Germanistik, moderne sprachlicher Hochschul- 
Fremdsprache) abschluss 
weitere Erfahrung mit Sprach- | 450 Stunden Lehrer- bei DaF-Studium: keine 
Voraus- prüfungen fahrung sonst: 100 Stunden 
setzungen 2-3 Jahre Lehrer- Online-Test (Prüfer) DaF-Qualifizierung 500 
fahrung auf hoher 1-tägige Schulung UE Lehr-/Prüfungser- 
Niveaustufe regelmäßige Seminare fahrung 
2-tägige Schulung; inkl. | (freiwillig) oder Lizen- 
Prüfer-Effekten (s.o.) zen für Prüfungen auf 
regelmäßige Weiterbil- | dem B2 Niveau 
dungsseminare 
vor jeder Prüfung: Kali- 
brierungsunterlagen 
Dokumen- | digitale Erfassung aller | Protokoll* Protokoll 
tation Prüfungsleistungen und 
der Beurteilung 
Inspektion | vorhanden vorhanden - 


* laut den Prüfenden unterschiedliche Angaben; vorwiegend zu Formalia: Prüfungsprotokoll A50'. 


TestDaF fordert für die Prüfenden ein sprachbezogenes Studium; die For- 
derung eines DaF-spezifischen Studiums bei der DSH ist neuer und wahr- 
scheinlich noch nicht flächendeckend berücksichtigt. Bei telc scheint ein 


1 Anmerkung einer Prüfenden: „Es gibt ein Protokoll für die gesamte Prüfung, also schriftlich 
sowie mündlich, ist aber nicht wirklich ein Inhaltsprotokoll, sondern dort wird eingetragen, ob 
alle Umschläge zu waren, wann die Prüfung anfing und zu Ende war, wie viele TN teilgenommen 
haben und ob es besondere Vorkommnisse gab. Außerdem werden dort nochmal die Namen der 
Prüfenden und telc Lizenz-Nummern angegeben. D.h., es gibt KEINE Aufzeichnungen von dem, 
was in der mündlichen Prüfung passiert, lediglich einmal den Bewertungsbogen, auf dem wir 
während der Prüfung unsere Bewertungen der einzelnen Teile eintragen können, was anschlie- 
Send von den Prüfenden auf den Prüfungsbogen übertragen wird. Platz für Kommentare sind 
da nicht wirklich.“ 
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sprachbezogenes Studium oder eine weitere Qualifizierung nicht obligato- 
risch. 

Ziel der folgenden qualitativen Studie ist es nun, durch teilstrukturierte Inter- 
views und Befragungen den Ist-Stand der Prüferqualifizierung zu erheben. Die 
meisten Wissenslücken in Bezug auf die Qualifizierung der Prüfenden liegen bei 
der DSH vor. Beim TestDaF und telc gilt es zu erfragen, was die genauen Inhalte 
der Schulung sind. Bei den nicht DaF- Absolventinnen des ISSK gilt es auch zu er- 
fragen, ob sie die geforderten 100 Stunden DaF-Qualifizierung absolviert haben. 
Neben einer Befragung von VertreterInnen der Institutionen bieten Befragungen 
der Prüfenden einen vielversprechenden Einblick in deren Qualifizierung. Aus 
den o.a. Analysen wurde eine Interviewleitfaden entwickelt. 


2 Studie 


Es handelt sich hier um eine qualitative Pilotstudie, die in größerem Umfang 
und dann auch quantitativ durchgeführt werden müsste. Befragt wurden die 
Institutionen selbst, aber auch jeweils drei Prüfende. Die Ergebnisse könnten 
als Grundlage für eine quantitative Studie genutzt werden. Zunächst werden 
die Ergebnisse der Befragung der Institutionen skizziert. Es folgen die Ergeb- 
nisse der Interviews mit den Prüfenden. 


2.1 Befragung der Institutionen 


Alle drei Institutionen waren sofort zur Mithilfe bereit. Dabei stellte sich die 
Problematik, dass bei der DSH die Verantwortlichen zugleich auch die Prü- 
fenden sind, also keine getrennte Befragung stattfinden konnte. Bei TestDaF 
und telc wurden die Organisation und die Prüfenden getrennt befragt. Dabei 
erhielten die Institutionen aus Kapitel 1 den Abschnitt zu ihrer Institution mit 
der Bitte um Kommentare und im Falle telc und DSH einige gezielten Fragen. 


2.1.1 TestDaF 


Bezüglich der Anzahl der Testzentren wird angemerkt, dass die Zahlen Ver- 
änderungen unterliegen. Ende 2018 waren es 519 Testzentren in 99 Ländern. 
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Hinzugekommen sind 2018 Testzentren in Argentinien, El Salvador, Kamerun 
und der Russischen Föderation. 

Ferner wird noch einmal präzisiert, dass die mündliche Prüfung digita- 
lisiert wird, der Terminus „Prüfender“ also besser durch Bewertender oder 
Beurteilender zu ersetzen wäre. Ergänzt wird bezüglich der Auswahl der Beur- 
teilenden, dass neben profunden Kenntnissen des GER auch explizit studien-, 
hochschul- und wissenschaftsbezogene Kompetenzen notwendig sind. Beur- 
teilende werden folglich in Bezug auf diese Kompetenzen überprüft. 


2.1.2 Telc 


Den Dokumenten war zu entnehmen, dass es keine separate Prüfung für C1 
Hochschule gibt. Dies wurde von telc bestätigt: 


Einen gesonderten Lizensierungskurs ausschließlich für C1 Hochschule 
gibt es in der Tat nicht, aber zwei Möglichkeiten eine C1 Lizenz zu er- 
werben, zum einen online, zum anderen über eine Präsenzveranstaltung 
im Rahmen einer C1-C2 Prüferqualifizierung. Wer Unterrichtserfahrung 
auf beiden Niveaus nachweist, erwirbt die komplette Lizenz. Alle, die nur 
C1 nachweisen können, erhalten die C1 Prüferlizenz. 


Aktive Teilnahme am Workshop, so telc, reicht nicht aus, vielmehr „müssen 
die Beiträge auch inhaltlich angemessen und qualifiziert sein“. 

Bezüglich der fehlenden Sensibilisierung für verzerrende Elemente in 
mündlichen Prüfungen merkt telc an, dass „die Prüfertrainer/innen dazu ge- 
schult sind und das Thema bei den passenden Videos einbringen“. 

Bestätigt wird, dass, anders als bei den anderen beiden Institutionen, keine 
DaF/DaZ Qualifizierung notwendig ist, um die Prüferqualifizierung zu absol- 
vieren. 


Erfahrene, ältere Kursleitende haben oftmals kein relevantes Studium 
absolviert, sondern waren Quereinsteiger/innen. Das bedeutet weniger, 
dass ihre Kompetenz gering ist, sondern reflektiert die Nicht-Existenz von 
DaF/DaZ-Studiengängen in früheren Jahren. telc bietet allen Kursleiten- 
den (DaF/DaZ-Absolventen/innen ebenso wie Quereinsteigenden) die 
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Möglichkeit eine Prüferlizenz zu erwerben unter der Voraussetzung, dass 
sie sowohl über ausreichende Unterrichtserfahrung als auch ausreichende 
Fachkompetenz verfügen. Bei berechtigten Zweifeln werden zusätzliche 
Nachweise angefordert. 


Gefragt wurde ferner nach dem Fehlen von Informationen zu den Gütekrite- 
rien in der Handreichung Prüferqualifizierung. 


Zur Vermeidung von Überfrachtung der Qualifizierung wird nicht ein- 
gehend auf dieses Thema eingegangen, ohne es jedoch gänzlich zu ver- 
nachlässigen. Reliabilität und Objektivität werden ferner im Rahmen 
der Herleitung der Bewertungskriterien sowie deren Anwendung bei der 
Bewertung von Testvideos thematisiert. 


Spezifischer wurde nach einer fehlenden Thematisierung der Verzerrung in 
der Handreichung gefragt. 


Obwohl in der Handreichung nicht ausführlich auf das Thema einge- 
gangen wird, wird es dennoch indirekt im Rahmen der Diskussion um 
Prüferverhalten angesprochen. Viele Hinweise, besonders unter der 
Rubrik „Was Sie nicht tun sollten‘, helfen bei der Vermeidung z. B. von 
Kontaminationseffekten oder schaffen Bewusstsein für den Einfluss von 
Persönlichkeitsfaktoren. Andere Verzerrungseffekte (z. B. den Haloeffekt) 
finden auf natürliche Weise Eingang in die Diskussionen über die Bewer- 
tung einzelner Videos, wenn die Seminarteilnehmenden genau in diese 
Falle tappen. 


2.1.3 DSH (ISSK) 

Das ISSK merkte an, dass es sich zwar nicht um eine standardisierte Prüfung 
handelt, jedoch die Rahmenordnung die Standards vorgibt und ein ausführ- 
licher Kriterienkatalog des FaDaF vorliegt. Dort sind die Standards exem- 
plarisch dargestellt. Ferner hat das ISSK inzwischen kein Mitglied mehr im 
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DSH-Zirkel. Zu der Frage, wer denn prüfen darf, wurde die Prüfungsordnung 
zitiert, in der steht: 


Prüferinnen und Prüfer sind haupt- und nebenamtliche Lehrkräfte des 
Lehrgebiets Deutsch als Fremdsprache. Sie bilden eine oder erforderli- 
chenfalls mehrere Prüfungskommissionen, die sich jeweils mindestens 
zur Hälfte aus hauptamtlichen Lehrkräften des Lehrgebiets Deutsch als 
Fremdsprache zusammensetzen. 


Allerdings wurde nicht deutlich, inwieweit eine tatsächliche DaF-Qualifizie- 
rung oder besser eine gezielte Prüferqualifizierung vorliegt. 


2.2 Befragung der Prüfenden 


Die qualitative Befragung erfolgte lediglich bei drei Prüfenden aus den jewei- 
ligen Bereichen. Die Daten wurden teils bereinigt, ohne dabei den Inhalt zu 
verändern. Die einzelnen Fragen werden in der Darstellung aufgeführt. Die 
Ausführungen bei der ersten Interviewten sind dabei jeweils am ausführlichs- 
ten, da es bei den Personen 2 und 3 oft zu Wiederholungen kam. 


2.2.1 TestDaF 


Frage 1: Was sind denn die Voraussetzungen, um Prüferin zu werden? 


P1: Voraussetzung für eine Beurteiler*innen-Tätigkeit ist einerseits ein 
einschlägiges Studium und andererseits (langjährige) Erfahrung im Be- 
reich Deutsch als Fremdsprache (DaF). 

P2 e P3: dito 


P1 verfügt über ein einschlägiges Studium sowie über langjährige Erfahrung 
mit Lehr- und Prüftätigkeit im Bereich DaF (Honorarlehrerin an TUs, Goethe- 
Institut, VHS; hauptamtlich im Bereich DaF im Hochschulbereich, dort auch 
DSH). Für das TestDaF-Institut ist sie seit 2002 als Beurteilerin in den Prü- 
fungsteilen Schriftlicher Ausdruck (SA) und Mündlicher Ausdruck (MA) so- 
wie Hörverstehen (HV) tätig und seit 2018 für die Prüfungsteile Schreiben und 
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Sprechen im digitalen TestDaF. Sie nimmt ferner an internen Kalibrierungen 
teil, die der Erstellung von Prüfungsaufgaben (SA, MA) sowie von Kalibrie- 
rungsunterlagen (SA, MA) fiir Beurteiler*innen eines Testdurchlaufs dienen. 
Sie leitet zudem „testsatzübergreifende Kalibrierungen“ (TüK). 

P2 hat ebenfalls ein einschlägiges Studium („Sprachlehr- und Lernfor- 
schung/Schwerpunkt DaF“) und unterrichtet in diversen Kursformaten. Sie 
bewertet mündliche Prüfungen seit 2017. Sie hat sowohl an der Qualifizierung 
als auch an der internen Kalibrierungsrunde für neue Modellsätze teilgenom- 
men. 

P3 verfügt ebenfalls über ein einschlägiges Studium und hat lange Erfah- 
rung im Bereich des DaF-Unterrichts und hat ebenfalls an der Qualifizierung 
und der Kalibrierungsrunde teilgenommen. 


Frage 2: Wie sieht die Prüferqualifizierung aus? 


P1: Die Qualifizierung als Beurteilerin für den TestDaF erfolgt in den vom 
TestDaF-Institut durchgeführten kostenfreien Schulungen. Die bisherigen 
TüK, ab 2020 Zertifizierungen, finden jeweils in der Region statt, sodass 
eine Teilnahme ohne übermäßigen Zeit- und Reiseaufwand möglich ist. 
Bis einschließlich 2019 war dabei eine jeweils ganztägige Schulung für 
jeweils einen Prüfungsteil, also schriftlicher Ausdruck (SA), mündlicher 
Ausdruck (MA) und Hörverstehen (HV), vorgesehen, ab 2020 im zwei- 
jährlichen Turnus verkürzt sich die Präsenz auf einen halben Tag pro 
Prüfungsteil bei schriftlichem und mündlichem Ausdruck, beim HV bleibt 
es bei einem ganzen Tag. Jedoch minimiert sich die tatsächliche Schu- 
lung keinesfalls, da sowohl vorbereitendes Material vom TestDaF-Institut 
zur Verfügung gestellt wird, als auch eine nachbereitende Aufgabe oder 
Leistung zwecks finaler Erteilung des Zertifikats für die Beurteilung von 
Prüfungsleistungen im papierbasierten TestDaF erbracht werden muss. 

P2: Die Qualifizierungen oder Schulungen sind kostenfrei und fanden bei 
mir an einem Wochenende statt; darüber hinaus waren „Hausaufgaben“ 
zu erbringen, die ein ausführliches Feedback erhielten. Ferner wurde ich 
nach einem ausführlichen Lebenslauf gefragt und musste eine Auflistung 
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der unterrichteten Unterrichtseinheiten auf den Niveaustufen B2 bis C2 
vorlegen. Jährlich finden Nachschulungen statt. 
P3: Die Beurteilerschulung findet jährlich statt, die Auffrischungen eben- 


falls regelmäßig. 


Frage 3: Was sind die Inhalte der Qualifizierung, wie die empfundene Qua- 
lität der Qualifizierung und fühlen Sie sich gut vorbereitet? 


P1: Die Inhalte der Qualifizierung zielen darauf ab, ein größtmögliches 
Verständnis für die Beurteilungsvorgaben des TestDaF-Instituts zu errei- 
chen und das Beurteilungsverhalten der Beurteiler*innen dahingehend 
zu optimieren. Zu diesem Zweck werden Schwierigkeiten hinsichtlich der 
Beurteilung einzelner Aufgaben des SA, MA, HV und einzelner Beurtei- 
lungskriterien thematisiert und diskutiert. Grundlage dafür sind Prü- 
fungsleistungen aus früheren Testläufen. Die Rückmeldung aus und der 
rege Austausch mit dem TestDaF-Institut, in der Präsenzschulung vertre- 
ten durch die Schulungsleiter*innen, sowie der Erfahrungsaustausch mit 
anderen Beurteiler*innen sind ein wichtiger Bestandteil der Zertifizierun- 
gen. Hierdurch fühlt man sich als Beurteiler*in alljährlich/zweijährlich 
„auf Kurs gebracht‘, eben kalibriert. Dies vermittelt Sicherheit für die 
kommenden Beurteilungssituationen. Auch die Rückmeldungen bezüg- 
lich Konsistenz und Strenge der eigenen Beurteilungen nach einem jeden 
Testlauf sind ein wichtiger Faktor, der Beurteiler*innen die für die Arbeit 
notwendige Sicherheit gibt. Sollte man sich in einer Beurteilungsphase 
trotz allem mit Problemen konfrontiert sehen, ist eine Kontaktaufnahme 
mit den Referatsleiter*innen der Weg, der allen Beurteiler*innen offen- 
steht. Dies ist ein weiterer Faktor, der Sicherheit vermittelt. Wie zu sehen, 
‚fühle ich mich ausreichend geschult und gut vorbereitet auf die Arbeit als 
Beurteilerin. 

P2: Die Qualifizierung ist jeweils nach schriftlich und mündlich getrennt. 
Es erfolgt eine Vorstellung des Testformats und des Aufbaus, im Detail: 
Teile der Aufgaben, Erwartungshorizont (Was sollen die Prüfungsteilneh- 
menden leisten?), Bewertungskriterien, einzelne Abstufungen, Honorar- 
abrechnung, statistische Auswertung und den internen Ablauf. Man hatte 
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noch immer großen Respekt vor der Bewertung und Durchführung, aber 
durch das individuelle Feedback, die Erklärung der Statistik, dass man da 
nicht allein verantwortlich ist, hat sich das abgemildert. Man bekommt 
nach jedem Bewertungsdurchgang ein Feedback. Ich fühle mich also sehr 
gut vorbereitet. 


P3: Die inhaltliche Darstellung ist identisch mit den beiden o.a. Berichten. 
Daher erfolgt hier die transkribierte Antwort auf die Frage: „Fühlten Sie sich 
denn gut vorbereitet?“ 


Auf alle Fälle. Wichtig ist jedoch neben der Schulung und den Auffri- 
schungen, dass man auch wirklich bewertet und sein Wissen anwendet. 
Die Kombination Schulung, Auffrischung und Erfahrung und der jährli- 
che Austausch sind ideal. Man denkt immer vor der Auffrischung: Muss 
das wirklich sein? Aber ich bin immer wieder froh, weil sich manchmal 
Dinge auch verschieben oder der Blick auf manche Kriterien ist zu starr 
geworden und der Austausch führt dazu, dass man manches überdenkt. 
Also die Qualifizierung ist auf jeden Fall zu empfehlen. Ich fühle mich 
sehr gut betreut. 


Frage 4: Was hat Ihnen bei der Prüferqualifizierung am meisten geholfen? 


P1: Es ist nicht ein Faktor auszumachen, der am meisten hilft, es ist das 
Gesamtpaket an Maßnahmen, die das TestDaF-Institut trifft und bereit- 
stellt. 

P2: Die Vorbereitung auf das Material, das individuelle Feedback, die 
genaue Erläuterung der Aufgaben und des Erwartungshorizonts. 

P3: Die gesamte Qualifizierung mit dem ausführlichen Feedback und 
dem regen Austausch. 


Frage 5: Wie sind Sie zu einer guten Prüferin geworden? 


P1: Intensive Vorbereitung und Betreuung durch das TestDaF-Institut 
waren und sind ein wichtiger Teil der Qualifizierung. Jedoch helfen die 
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besten Maßnahmen nicht, wenn nicht auch die Bereitschaft besteht, sich 
selbst in seinem Beurteilungsverhalten immer wieder in Frage und auf 
den Prüfstand zu stellen. Ich verfüge NICHT über eine Selbstzufrieden- 
heit als Prüferin. Das hilft mir, offen zu bleiben für Verbesserung und 
Optimierung. 

P2: Der Austausch mit Kollegen/-innen durch Feedback und Nachschu- 
lungen sowie die Bearbeitung der Modellprüfungen. 

P3: Wie bereits dargelegt: die Kombination aus Erstqualifizierung, dem 
eigentlichen Bewerten, den Auffrischungen und dem Austausch mit den 
Kollegen und Kolleginnen. 


Frage 6: Wird die Prüfung aufgezeichnet? Wenn nicht, wird ein ausführliches 
Protokoll angefertigt? Was wird im Protokoll vermerkt? 


P1: Zu dieser Frage müsste die prüfende Institution befragt werden. Hin- 
sichtlich der Beurteilung von Prüfungsleistungen ist zu sagen, dass das 
TestDaF-Institut von den Beurteiler*innen ausreichende Begründun- 
gen dafür erwartet, mit welcher Niveaustufe (TDN) einzelne Items auf 
Grundlage der Kalibrierungsunterlagen zum jeweiligen Testlauf beurteilt 
werden. Auf diese Weise wird die Beurteilungsarbeit der einzelnen Beur- 
teiler*innen dokumentiert. 

P2: Die mündliche Prüfung wird aufgezeichnet, die Bewertung findet zu 
Hause statt und man füllt einen Bewertungsbogen mit präzisen Beispielen 
aus. 

P3: dito 


Frage 7: Wie viele Bewertende bewerten eine Prüfung? 
P1: Auch zu dieser Frage müsste die prüfende Institution befragt werden. 
P2: Eine Bewertung, aber mit statistischer Bereinigung; bei Zweifelsfällen 


kommt ein zweiter Bewerter hinzu. 
P3: dito 
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Frage 8: Nach welchen Kriterien beurteilen Sie denn miindliche Texte? Wie 
wurden Sie in der Qualifizierung diesbeziiglich geschult? 


P1: Das habe ich ja bereits bei den Inhalten der Qualifizierung und der 
Frage nach dem gut vorbereitet sein beantwortet. Die Kriterien liegen 
vor, werden intensiv behandelt und sind somit zentraler Bestandteil der 
Qualifizierung. 

P2: Nach den gegebenen Bewertungskriterien und immer vor dem Hinter- 
grund: Kann diese Person mit diesem aktuellen Sprachstand ein Studium 
in D aufnehmen und im „Unidschungel“ bestehen und sich weiterentwi- 
ckeln. Dies wurde in der Qualifizierung ausfiihrlich geschult und es gab 
immer wieder Riickmeldung zur Bewertung. 

P3: Also wir haben ja unsere Kriterien, wo wir jede miindliche Aufgabe 
nach diesen acht Kriterien bewerten und meistens geht es dann darum, 
diese zu hinterfragen, also genauer zu tiberpriifen, wie wurde das um- 
gesetzt, wie kann ich das fiir mich noch ein wenig eingrenzen und an 
konkreten Beispielen gucken, wie habe ich mir vielleicht diesen Deskriptor 
so schön zurechtgelegt, der dann doch nicht so ganz passt. Wichtig ist, sich 
immer zu hinterfragen. 


Frage 9 & 10: Was versteht man denn unter dem sog. Positionseffekt? War 
das Bestandteil der Priiferqualifizierung? Und was verbirgt sich hinter dem 
Halo-Effekt? Wurde dies in der Priiferqualifizierung behandelt? 


P1: Der Positionseffekt und auch der Halo-Effekt sind Phänomene, die 
in den Zertifizierungen immer wieder angesprochen werden, da diese 
Effekte nur allzu menschlich sind, aber selbstverständlich weitestgehend 
vermieden, zumindest aber minimiert werden müssen. Denn nur so kann 
eine faire, allen Prüfungsteilnehmer*innen gerecht werdende Beurteilung 
ihrer Leistungen gewährleistet werden. Bei einer Beurteilung von Prü- 
fungsleistungen in einem Umfang von 20, 50 oder gar mehr Leistungen 
ist der Positionseffekt eine stetige „Gefahr“. Haben wir beispielsweise eine 
Reihe sehr schlechter Leistungen beurteilen müssen, freuen wir uns über 
die eine Leistung, die besser ist, und neigen dazu, diese zu gut zu beurtei- 
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len. Vermieden werden kann dies am ehesten, wenn jede Prüfungsleistung 
einzeln betrachtet wird und keinerlei Rückblicke auf und Vergleiche mit 
vorherigen vorgenommen werden. 

Auch der Halo-Effekt muss unbedingt vermieden werden. Die Anonymi- 
sierung von Prüfungsleistungen mittels TN-Nummern ist solch ein Ver- 
such der Vermeidung. Jedoch verraten Schriftbild (beim SA oder HV) 
und/oder Akzent (beim MA) erfahrenen Beurteiler*innen oft recht deut- 
lich, welche Nationalität, Ausgangssprache und typische Schwierigkeiten 
und Fehler die Prüfungsteilnehmer*innen zeigen werden. Eine mögliche 
Vor-Beurteilung, der Halo-Effekt, steht also im Raum. Vermieden werden 
kann dies nur dadurch, dass man sich dieser typischen Schwierigkeiten 
und Fehler vielleicht bewusst ist, diese aber nicht als Rechtfertigung für 
gute und/oder schlechte Leistungen heranzieht, beispielsweise „für einen 
XY ist das aber schon ganz gut“ oder „das können XY halt nicht besser“. 
Im Fokus der Beurteilung von Sprachleistungen sollte eher die Verständ- 
lichkeit und Korrektheit der Performanz stehen. 

P2: In der Schulung ist man sehr intensiv auf diese Effekte eingegangen 
und wir haben immer wieder über das Prüferverhalten gesprochen und 
dass man Dinge auch mal „liegen lassen“ und neu starten muss. 

P3: Aufjeden Fall. Auch schon in der Erstqualifizierung wird da sehr viel 
Wert draufgelegt. 


Frage 11: Was möchten Sie uns eventuell noch über die Qualifizierung be- 
richten? 


P1: Nichts, es scheint mir vieles gesagt. Bei weiteren Nachfragen stehe ich 
aber gern zur Verfügung. 

P2: Das digitale Format ist in Bezug auf das Aufgabenformat sehr viel 
näher an den Uniaufgaben, die Studierende zu bewältigen haben. Es wird 
viele Teilnehmende vor Herausforderungen stellen, weil sie es nicht ge- 
wohnt sind, aber es zeichnet ein realistischeres Bild. Viel zu viele Zertifi- 
kate, egal welches, werden zu leichtfertig vergeben und ich habe die Studis 
dann in meinen Deutschkursen an der Uni sitzen und darf noch einmal 
eine Satzklammer etc. erklären. Gleiches gilt aber auch für normale Kur- 
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se. Lehrkräfte sollten öfter mal ‚nein‘ zu einer Weiterstufung sagen, auch 
wenn es den Teilnehmenden nicht gefällt. 

P3: Ich kann nur sagen, dass ich das [die Qualifizierungen] immer als 
extrem gut organisiert und vorbereitet finde und mich da richtig gut auf- 
gehoben fühle, also im Ganzen. Da ist einfach eine gute Atmosphäre, um 
da zu arbeiten und auch von der Konstellation passt es immer. Manchmal 
trifft man die gleichen Beurteiler, mit denen man sich sehr gut austau- 
schen kann, manchmal neue - immer anregend. Es ist auf jeden Fall eine 
sehr fruchtbare Zusammenarbeit. 


22.2 Tel 


Frage 1: Was sind die Voraussetzungen, um Prüferin zu werden? 


Pl: Wenn ich das richtig in Erinnerung habe, muss man lediglich 
Unterrichtserfahrung von 450 Stunden und Kenntnisse mindestens auf 
dem gleichen Niveau haben, das man dann prüft und natürlich die Qua- 
lifizierung absolvieren. 

P2: Unterrichtserfahrung auf dem Niveau C1. Aber ich wurde auch nicht 
gefragt. 

P3: Danach wurde ich nicht gefragt, aber ich habe ja ein DaF-Studium, 
braucht man aber glaub nicht unbedingt. 


P1 hat selbst sowohl einen Fernstudienkurs DaF am Goethe-Institut/Univer- 
sität München absolviert, ein abgeschlossenes Masterstudium DaF/DaZ und 
arbeitet seit 2014 im Bereich DaF auf allen Niveaustufen und das sowohl im 
universitären Bereich als auch im Integrationsbereich. telc-Prüferqualifizierun- 
gen (DTZ, B1-B2 und C1-C2) hat sie 2017 und 2018 erworben. 

P2 hat ebenfalls ein einschlägiges Studium. Die telc-Prüferlizenz hat sie 
seit 2012 und das auf allen Niveaustufen (B1/B2, C1/C2 und C1+ Hochschule 
sowie Briefbewertung). 

P3 hat ebenfalls DaF studiert und die Prüferlizenz seit 2014, ebenfalls auf 
allen Niveaustufen. 
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Frage 2a: Was sind die Inhalte der Qualifizierung, wie die empfundene Quali- 
tät der Qualifizierung [und fühlen Sie sich gut vorbereitet? - hier als separate 
Frage] 


P1: Die Erstschulung umfasst 8 Stunden und die Inhalte der Qualifizie- 
rung entsprechen den offiziellen Angaben auf der Homepage; also eine 
Vertiefung des Wissens über den GER, das Kennenlernen der Kriterien 
fiir die Bewertung der mündlichen Leistungen sowie das Diskutieren und 
Bewerten mündlicher Leistungen anhand von Videoaufzeichnungen; da- 
bei wird auch das Prüferverhalten analysiert. Daneben gibt es eine on- 
line-Qualifizierung. Die Schulungsreferent*innen waren gut vorbereitet 
und erfahren, sowohl als Referenten als auch selbst als Prüfer*innen. Die 
Teilnehmergruppe bei der Erstschulung schien mir, erstaunlicherweise, als 
heterogen bezüglich wichtigem Vor- und Grundlagenwissen, z.B. hinsicht- 
lich des Prüfens allgemein. Daher war es schwierig, alle „richtig abzuho- 
len‘; und somit erscheint mir die Schulung an nur einem Tag zu wenig. 
Die Auswahl der für das Bestehen zu bewertenden Videos erschien mir 
manchmal zu „einfach“, solche „Paradebeispiele“ an (guten) Prüflingen 
hat man in der Realität eher selten. Hier wäre wirklich authentischeres 
Material hilfreich. Problem dabei: Die Prüflinge müssen der Videoauf- 
nahme zustimmen, schlechtere TN machen das weniger gern oder nicht. 
Ich bezweifle auch, dass man mit den drei Lizenzen online eine Lizenz im 
Bereich „Pflege“ machen kann. Hier sollte ein längerer Präsenz-Termin 
obligatorisch sein. 

P2: Die Erstschulung ist acht Stunden und sie ist leider kostenpflichtig. 
Eine Nachschulung habe ich nach drei Jahren absolviert, aber auch die ist 
kostenpflichtig (4 Stunden a 40€). Die Inhalte umfassten die GER-Skalen, 
den Prüfungsaufbau, die Bewertungskriterien, einige Prüfungsbeispiele 
mit dem Vergleich der eigenen Einschätzung mit der telc-Einschätzung. 
Die eigene Prüfungsbewertung hat der Dozierende mit nach Hause ge- 
nommen und später erfuhr man, ob man die Lizenz bekommt oder nicht. 
Das machte einen ziemlich willkürlichen Eindruck. 

P3: Wie auch aufder Homepage angegeben, acht Stunden. Der Fokus liegt 
aufden GER-Skalen, dem Prüfungsaufbau und den Bewertungskriterien. 
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Mittels Videos von Priifungen wird diskutiert. Leider fehlt ein Feedback 
zu der eigenen Einschätzung. 


Frage 2b: Fühlen Sie sich gut vorbereitet? 


P1: Gut vorbereitet fühlte ich mich vor allem nach der 1. Schulung nicht. 
Nach der Theorie und den Videos weiß man einfach noch nicht, was es 
heißt, eine Prüfung selbst abzunehmen. Aber man ist ja zu zweit und kann 
v.a. bei den ersten Prüfungen den „passiven“ Teil übernehmen (= „nur“ 
bewerten, nicht die Prüfung leiten). Mit gesammelter Prüfungserfahrung 
kann man in den Schulungen gut diskutieren oder Fragen klären. Daher 
ist es auch gut, trotz Möglichkeit einer Online-Schulung, in regelmäßigen 
Abständen zu Präsenz-Schulungen zu gehen. 

P2: Ich fühlte mich nach der Prüferqualifizierung sehr in der Luft hän- 
gend, vor allem da man auf die finale individuelle Prüfungsbewertung nie 
ein Feedback bekommt. Auch heute bekommt man keine Rückmeldung 
über Strengegrad, Durchführung, etc. Veränderte Regularien bekommen 
auch immer nur die Testzentren, Prüfende haben Glück, wenn sie den 
Newsletter abonniert haben und es da drinsteht. 

P3: Nein, die Informationen im Studium dazu waren ausführlicher. Mit 
dem Wissen aus dem Studium, den Schulungen und dem Austausch mit 
dem Zweitprüfenden erlangt man aber nach einer gewissen Zeit eine ge- 
wisse Prüfungssicherheit. 


Frage 3: Was hat Ihnen bei der Prüferqualifizierung am meisten geholfen? 


P1: Beispielvideos von realen Prüfungen anzuschauen und die Bewertung 
im Plenum zu besprechen, und vor allem bei Uneinigkeit zu diskutieren. 
Der Austausch mit anderen TN/KL zu Schwierigkeiten beim Prüfen (v.a. 
bei der allerersten Schulung, wenn man selbst noch keine Prüferfahrung 
hat) und das konkrete Ausfüllen der Original-Bewertungsbögen, wie in 
der Prüfung selbst. 

P2: der Austausch mit Kolleginnen. 
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P3: Wie eben schon gesagt, die Kombination aus Studium, der Schulungen 
und dem Austausch mit den anderen Prüferinnen. 


Frage 3: Wie sind Sie zu einer guten Prüferin geworden? 


P1: „learning by doing‘, also durch Erfahrung und Durchführen von Prü- 
fungen, Austausch mit Priiferkolleg/innen, also eine Kombination aus 
Wissen, Einhaltung der Richtlinien und „Menschenverstand“. 

P2: Der Austausch mit den Kolleginnen, das Bewerten während der 
Prüfung mit Kolleg*in und „richtige“ Qualifizierungen zum mündlichen 
Prüfen. 

P3: Übung macht den Meister - ich denke, dass ich inzwischen recht 
sicher beim Prüfen bin. 


Frage 4: Wird die Prüfung aufgezeichnet? Wenn nicht, wird ein ausführliches 
Protokoll angefertigt? Was wird im Protokoll vermerkt? 


P1: Nein, keine Aufzeichnung (weder Ton noch Video), aber ausführliches 
Protokoll zu mündlichen Leistungen der Prüflinge zu jeder Aufgabe und 
anschließender Absprache und Vergleich mit Co-Prüfer*in für die Endbe- 
wertung. Je nach Prüfung müssen sich die Prüfenden bei der Bewertung 
nicht einig sein, man nimmt dann den Mittelwert. 

P2: Nein, es gibt ein Protokoll, in dem die Prüfungskoordination Unregel- 
mafigkeiten notiert werden. „Gelbe“ Prüferbewertungen bleiben bei der 
Sprachschule, aber was ein Prüfer dort aufschreibt, ist ihm/ihr überlassen. 
Je nach Prüfenden also entweder ein ausführliches Protokoll oder aber 
sozusagen nichts. 

P3: Jein, es gibt ein Protokoll, aber je nach Prüfendenkonstellation wird 
mehr oder weniger notiert. 


Frage 5: Wie viele Bewertende bewerten eine Prüfung? 


P1: Immer zwei: davon mindestens ein/e Externe/r, d.h. ein Prüfender, der 
nicht an der Institution arbeitet, an der die Prüfung abgenommen wird. 
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Oder aber, wenn er die Priiflinge seit mindestens 6 Monaten nicht mehr 
unterrichtet, damit Objektivität gewährleistet ist. 

P 2: Zwei Bewertende. 

P3: dito 


Frage 6: Nach welchen Kriterien beurteilen Sie denn mündliche Texte? Wie 
wurden Sie in der Qualifizierung diesbezüglich geschult? 


P1: Nach den Kann-Beschreibungen des GER sowie den Bewertungs- 
kriterien und -kategorien von telc. Alle Anforderungen sind schriftlich 
formuliert, in den Handbüchern, die man in den Schulungen ausgeteilt 
bekommt. Diese können auch während der Prüfung nachgelesen werden. 
In der Schulung selbst findet eine ausführliche Vorstellung, Bearbeitung 
und Besprechung des GER statt, von Grobskala bis zu einzelnen Kann-Be- 
schreibungen der Fertigkeiten. Der Fokus liegt natürlich auf mündlicher 
Produktion (in der Schulung: z.B. Zuordnung der Kann-Beschreibung 
auf Karten nach Niveau, gemeinsames Festhalten der wichtigsten Unter- 
scheidungsmerkmale der Niveaustufen, also z.B. Was ist gutes B1, aber 
noch nicht B2?). 

Beim Ansehen der Videos und dem gemeinsamen Bewerten der Beispiel- 
prüfungen werden die telc-Bewertungen besprochen. Dabei kommt es 
jedoch häufig zu einer „Nichtübereinstimmung“ der Teilnehmenden mit 
den telc-Referenten und es wird diskutiert. Dabei bewerten mal die Teil- 
nehmer, mal telc „zu nett“. Die Teilnehmenden in der Qualifizierung ver- 
mischen oft sprachliche und inhaltliche Ebene und sanktionieren doppelt. 
Ich sehe hier folgende Schwierigkeit: die telc-Musterbewertung richtet sich 
zwar nach dem GER, wird aber im Einzelnen von einem relativ kleinen 
Kreis von telc-Prüfern und Schulungsreferent*innen vollzogen; das Team 
wird laut telc auch regelmäßig geschult und sie müssen unabhängig vonei- 
nander immer wieder Prüfungen bewerten, um zu kalibrieren, aber eine 
gewisse Heterogenität ist schon festzustellen. 

P2: Nach den vorliegenden Bewertungskriterien. Die Schulung zum 
Bewerten an sich wäre durchaus ausbaufähig. Einigen Teilnehmenden 
würde ich, auch wenn sicher dumm für sie, die Lizenz nicht ausstellen. 
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P3: Die Bewertungskriterien wurden sehr ausführlich diskutiert und 
grundsätzlich würde ich die Schulung hier als sehr hilfreich ansehen. Aber 
hier wird die Heterogenität der Teilnehmenden sehr deutlich. Bei einigen 
hat man den Eindruck, es wäre ihr Erstkontakt mit dem GER oder dem 
Hochschulbereich. 


Frage 7: Was versteht man denn unter dem sog. Positionseffekt? War das Be- 
standteil der Prüferqualifizierung? Und was verbirgt sich hinter dem Halo- 
Effekt? Wurde dies behandelt? 


P1: Keine Ahnung - die Auswirkung der Anordnung der Fragen auf die 
Beantwortung in der Prüfung? Das war nicht Bestandteil der Schulung, 
falls doch wurde das so nicht genannt. Oder „Position beziehen“ in der 
Rolle als Prüfer/in? Also, das Prüferverhalten hat Auswirkung auf Beant- 
wortung seitens der TN? Das wurde in der Schulung nicht thematisiert. 
In der Schulung wird bzgl. skalierter Prüfungen besprochen, dass man zu- 
nächst mit Fragen des niedrigeren Niveaus beginnen soll und ggf. (je nach 
Niveau des TN) dann Fragen stellen, die das höhere Niveau testen (z.B. 
bei DTZ sind diese vorgegeben). Außerdem werden auch Dos and Don'ts 
eines Prüfers besprochen und wie man sich als Prüfer*in verhalten sollte. 
Hm, Halo-Effekt, vielleicht Fehler bei der Personen-/Leistungsbeurteilung 
durch dominantes Merkmal, womit anderes in den Hintergrund gerät 
bzw. nicht mehr berücksichtigt wird und letztlich zur „falschen“ Beurtei- 
lung führt? Bei keiner meiner Schulungen wurde dieser Begriff explizit 
thematisiert, auch wenn wir uns mit dem allgemeinen Prüferverhalten 
beschäftigt haben. Wobei ... bei der ersten Schulung in einer Beispiel- 
prüfung im Video ein Prüfling eine sehr „komische“ Stimme hatte oder 
so, jedenfalls ein physisches Merkmal, das einen auf Dauer irritierte. In 
der Diskussion stellte sich heraus, dass die meisten der Schulungs-TN 
sich davon beeinflussen ließen und eine „schlechtere“ Bewertung gaben. 
Wobei die sprachliche und inhaltliche Leistung nicht darunter litt (das 
Video wurde nochmals gezeigt). 

Außerdem, wie oben erwähnt, wird in den Schulungen, anhand der Bei- 
spiele darauf hingewiesen, dass man die inhaltliche und sprachliche Ebe- 
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ne nicht vermischen solle. Also „nur“, weil jemand ständig den gleichen 
Grammatikfehler macht, kann die Aufgabe dennoch inhaltlich gut erfüllt 
worden sein. Also nur Abzug bei „sprachlicher Korrektheit‘, nicht aber 
bei ,, Aufgabenerfiillung* 

P2: (zu beidem): Wenn bei einer meiner Qualifizierungen jemand danach 
gefragt hat, wurden die Effekte angesprochen, jedoch je nach Trainer/in 
sehr unterschiedlich intensiv behandelt. In der eigentlichen Qualifizierung 
werden die Effekte nicht behandelt. 

P3: Kann ich nicht wirklich etwas zu sagen. Sehr ausfiihrlich behandelt 
wurde, dass wir Sprache und Inhalt getrennt bewerten müssen, also Inhalt 
kann auch gut sein, wenn die Grammatik daneben ist. 


Frage 8: Was möchten Sie uns eventuell noch über die Qualifizierung be- 


richten? 


P1: Es gibt klare Voraussetzungen, um an einer Prüferqualifizierung 
teilnehmen zu können und somit lizenzierte/r Prüfer/in zu werden. Es 
werden bei der Anmeldung für die Schulungen jedoch keinerlei Nachweise 
dafür verlangt. Man muss nur einmalig (ich glaube zur ersten Präsenz- 
schulung) vorab einen „Test“ online ausfüllen. Dieser beinhaltet Fragen 
zu den telc-Richtlinien und dem GER. Die Informationen dazu werden 
als pdf bereitgestellt und können zum Ausfüllen natürlich benutzt wer- 
den und können oft selbsterklärend beantwortet werden (bestimmt auch, 
wenn man nicht unbedingt vom Fach ist). Dann braucht man sich in der 
Schulung auch nicht zu wundern, welche Leute dort so sitzen (wirken 
unerfahren und haben z.B. vom GER noch nichts gehört bzw. nur aus 
dem Vorbereitungsteil von telc selbst). 

Ich finde die Lizenzerteilung nicht wirklich professionell und transparent. 
Als Voraussetzung gilt die Teilnahme der Präsenzschulung, das richtige 
Bewerten einer Prüfung (per Video) und „aktive Mitarbeit“ bei der Schu- 
lung selbst. Man kann an der Schulung teilnehmen, auch ohne Nachwei- 
se der geforderten Voraussetzungen. Die Bewertung der Prüfung findet 
nach den gemeinsam besprochenen Prüfungen statt. Das soll zwar in 
Einzelarbeit passieren, aber das Vergleichen mit dem Nachbarn und das 
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Ausbessern ist möglich und gängig (wird vom anwesenden Referenten 
nicht wirklich unterbunden, ggf. auch von Referenten abhängig). Die für 
die Lizenz zu bewertende Prüfung ist meist eine sehr „einfache‘, also 
vom Niveau her klar zuordnungsbare Prüfung; eine Abweichung von der 
Musterlösung innerhalb der gleichen Niveaustufe ist geduldet, doch auch 
bei nichtzutreffender Bewertung ist die Erteilung der Lizenz möglich, da 
die „aktive Mitarbeit“ (Fragen beantworten, an Diskussion teilnehmen...) 
anscheinend stärker gewichtet wird. Das bekommt man als TN aber ei- 
gentlich gar nicht mit, der Referent muss zu jeder/jedem TN einen Bogen 
ausfüllen, was m.E. bei der großen Anzahl der TN oft schwer möglich ist, 
während des Präsentierens selbst. Darüber werden die TN zwar zu Beginn 
informiert und auch zur aktiven Teilnahme aufgefordert, dennoch weiß 
man als TN am Ende nicht wirklich, worin man nun „gut“ war. Man 
glaubt automatisch, man habe die mündliche Bewertung richtig gemacht. 
Wie oben beschrieben findet eine Prüfung immer zu zweit statt. Man hat 
also die Möglichkeit einige Prüfer-Kolleg*innen kennenzulernen. Dabei 
wird deutlich, dass je nach Verhalten und „Einstellung“ der Prüfer*innen, 
die Prüfung ganz unterschiedlich und auch nicht immer „standarisiert“ 
verlaufen kann, also z.B. die Frageweise, bei ständigen Ja/Nein-Fragen 
einer Prüferin bekommt man wenig zu bewerten. Wobei man ja mei- 
nen sollte, wenn alle gleich geschult wurden, sollten auch die Prüfungen 
„gleich“ ablaufen... 

P2: Meiner Meinung nach sollten Qualifizierungen kostenlos sein, denn 
man führt einen Service für diese Institution durch und wenn man schon 
bezahlt, sollten Kenntnisse geprüft und Feedbacks gegeben werden, so dass 
man sich besser aufgehoben fühlt. Bei telc erneuere ich nur noch Lizenzen, 
bei denen ich weiß, dass ich bei einer Sprachschule prüfen oder bewer- 
ten kann. Die Betreuung der Prüfer/Bewerter durch telc selbst ist extrem 
schlecht. Das Honorar wurde zwar angehoben, aber dennoch machen nur 
die wenigsten Lehrkräfte eine Bewerterschulung, da es sich nicht lohnt und 
auch die negativen Erfahrungen dominieren. Welche andere Institution 
setzt bitte Aufgaben aus Modellsätzen in realen Prüfungen ein? 

P3: Mir haben die Schulungen Spaß gemacht und ich habe auch immer et- 
was Neues mit nach Hause genommen. Es waren immer auch spannende 
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Leute dabei. Etwas nervig ist es, wenn zu viele der Teilnehmerinnen recht 
wenig Ahnung von DaF haben, also Lernervariablen, Lerntraditionen 
und vor allem Methoden. 


2.2.3 DSH am ISSK 


Frage 1: Was sind die Voraussetzungen, um Priiferin zu werden? 


P1: Voraussetzung ist ein Studium im Bereich Germanistik, am besten in 
Ergänzung mit einem DaF-Abschluss. 

P2: Studium und Anstellung am ISSK. 

P3: Studium und Anstellung am ISSK, also keine Lehrbeauftragten. 


P1 hat sowohl Germanistik als auch DaF studiert und unterrichtet seit 2001 
DaF. Im Studium selbst wurde kein Modul zum Testen und Prüfen angeboten, 
so dass sie sich diesen Bereich autodidaktisch, durch Austausch mit Kollegen 
und Kolleginnen, Weiterbildungen und Tagungen erschlossen hat. 

P2 hat ebenfalls ein DaF-Studium (Master) absolviert, prüft aber erst seit 
ca. 1 Jahr. Es gab in ihrem Studium kein komplettes Seminar zum Prüfen und 
Testen, jedoch verschiedene Sitzungen zu Testformaten. In einem Seminar 
zu Unterrichtskonzepten wurde jedoch darüber hinaus spezifischer auf die 
DSH und die Prüfungsaufgaben eingegangen, ohne dies jedoch explizit als 
DSH-Prüfungsformate zu benennen. 

P3 hat Germanistik mit Schwerpunkt Literaturwissenschaft studiert und 
war als DAAD Lektor in Polen und China im Bereich DaF tätig (seit 2005), der 
erste DaF-Kurs fand in China statt und hier hat P3 auch Vorbereitungskurse 
für TestDaF gegeben. Seit 2017 ist P3 am ISSK festangestellt. Eine Prüferqua- 
lifizierung, die jedoch als wenig zielführend beurteilt wird, fand bei telc statt. 


Frage 2: Haben Sie eine externe Prüferqualifizierung gemacht? 
Pl: nein. 
P2: nein. 


P3: ja, bei telc (2015), aber nur Al (und der „Workshop“ war nicht wirk- 
lich zielführend) 
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Frage 3: Wie sind Sie zu einer guten Prüferin/einem guten Prüfer geworden? 


P1: Da ich selbst die vorbereitenden DaF-Kurse anbiete, die schließlich 
zur DSH führen (also die sog. „studienvorbereitenden Kurse“), und ich 
somit die genauen Ziele und Erwartungen in Anlehnung an den GER 
kenne, kann ich dieses Wissen sehr gut auch bei der Prüfung berücksich- 
tigen. Ich kann so sehr gut beurteilen, ob die Ziele, also das Niveau auch 
nach dem GER, erreicht wurden. Vorteilhaft dabei ist, dass ich auch die 
Entwicklung der Prüflinge beurteilen kann. Mit ist jedoch bewusst, dass 
dies die Bewertung beeinflussen könnte. Das versuche ich zu verhindern. 
P2: Ich bin noch auf dem Weg dahin, die vielen Diskussionen mit der 
Prüferin helfen dabei aber sehr und ich unterrichte ja auch am ISSK. 
P3: Ich habe bereits viel Erfahrungen mit mündlichen Prüfungen im Aus- 
land gesammelt und seit 2017 dann auch mit der DSH am ISSK, wobei 
ich zunächst Protokollant war. Beim ersten Mal, wie immer, ist man beim 
Protokollführen noch nicht so geübt. Ich habe gelernt, wie wichtig es ist, 
wirklich alles sehr genau und konsequent zu protokollieren. Ich habe mir 
viel von den Kollegen abgeschaut und man braucht auch die Erfahrung 
und man darf die mündliche Prüfung nicht als Anhängsel sehen. Der 
Austausch mit den Kolleginnen ist immer ein Vorteil. 


Frage 4: Wird die Prüfung aufgezeichnet? Wenn nicht, wird ein ausführliches 
Protokoll angefertigt? 


P1: Nein, aufgezeichnet wird nicht, aber gerade bei der mündlichen Prü- 
fung wird ein sehr ausführliches Protokoll angefertigt, das dann bei der 
Bewertung herangezogen werden kann. Formalia werden ebenfalls im 
Protokoll festgehalten, das „Verlaufsprotokoll“ ist aber sehr viel relevanter 
und nachvollziehbar. 

P2: Nein, aber ich mache mir sehr viele Notizen und aufgrund der No- 
tizen und dem Gesamteindruck wird dann diskutiert. Dabei werden die 
Gründe für die Punktevergabe nicht zwingend notiert. 

P3: Wie oben schon beschrieben, ist ein ausführliches Protokoll sehr wichtig, 
um auch den Studierenden sagen zu können, warum sie so bewertet wurden. 
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Frage 5: Wie viele Bewertende bewerten eine Prüfung? 


P1: Jeweils zwei Personen, einmal der/die Prüfer/in und ein/eine Proto- 
kollantin, der/die aber auch immer selbst Prüfer ist. Die Bewertung erfolgt 
durch beide und das unter Zuhilfenahme des Protokolls. Wir diskutieren 
hier sehr ausführlich. 

P2: dito 

P3: dito 


Frage 6: Nach welchen Kriterien beurteilen Sie denn mündliche Texte? [Wie 
wurden Sie in der Qualifizierung diesbezüglich geschult?] 


P1: Wie dargestellt, gibt es keine spezifische Prüferqualifizierung. Die Kri- 
terien sind jedoch standardisiert in einem Kriterienkatalog festgehalten. 
Es können 100 Punkte vergeben werden, 100 Punkte wären dann 100%. 
P2: Wir haben einen sehr ausführlichen Bewertungsbogen und differen- 
zieren dann sehr genau nach Inhalt und Sprache; auch Aussprache - aber 
nur am Rande - wird bewertet. 

P3: Wir haben unseren Bewertungsbogen, wir sprechen uns sehr ausführ- 
lich über die Bewertung ab und wir haben auch über eine virtuelle münd- 
liche Prüfung nachgedacht. Das hätte aber logistische Hürden zum einen 
und wir hätten einen anderen Bewertungsbogen entwickeln müssen. Im 
Vergleich empfinde ich, zumindest unsere DSH, als das beste Prüfungs- 
format. Die Anerkennung von telc Hochschule machen wir „zähneknir- 
schend“. Ich kenne alle drei Prüfungen und bin überzeugter Vertreter 
der DSH, denn ich denke, es ist die Prüfung, die die Studierfähigkeit 
am exaktesten nachprüfen kann (bezogen auf die gesamte Prüfung, nicht 
das Mündliche), weil sie in der Aufgabenstellung zwischen geschlossen, 
halb-geschlossen, halb-offenen und offenen Fragestellungen am besten die 
Kompetenzen abbildet. Man überprüft z.B. nicht nur das reine Textver- 
ständnis z.B. beim Leseverstehen, sondern auch, ob sie darüber reflektie- 
ren können, also nicht reine Informationsentnahme, sondern auch die 
Frage, wie ihre Haltung dazu ist. Können die Prüfungskandidaten auch 
zwischen den Zeilen lesen? 
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Frage 7: Berücksichtigen Sie spezifische Verzerreffekte? Hatten Sie dazu eine 
Weiterbildung? 


P1: Nein, wir haben dazu keine Weiterbildung oder Schulung erhalten, 
versuchen aber immer jede Prüfung sehr objektiv zu bewerten. Vielleicht 
sollten wir uns mit der Thematik noch näher auseinanderzusetzen. 

P2: Nein, also weder im Studium noch vor den Prüfungen, habe ich etwas 
zu Verzerreffekten gemacht. Aber bei der ersten richtigen Prüfung hat die 
Prüferin, ich war Protokollantin, sich sehr viel Zeit genommen, um mit 
mir über die Prüfung und die Bewertung zu sprechen. Also wirklich dann 
auch ein „learning by doing“. 

P3: Nein, auch bei der telc-Qualifizierung wurde das nicht angesprochen. 
Aber trotzdem haben wir zwischen den Prüfungen Zeit, um darüber zu 
sprechen, ob wir vielleicht von den schriftlichen Leistungen beeinflusst 
sind. Und eine meiner Kolleginnen thematisiert auch die möglichen 
„menschlichen“ Einflüsse auf die Prüfungsbewertung. Aber so ein „Über- 
bau“ zu den Verzerreffekten, also eine Bewusstwerdung, wäre sicher 
sinnvoll. 


3 Fazit und Ausblick 


Unabhängig von der Qualität der Prüfungen an sich, die bei TestDaF und telc 
standardisiert sind, während die DSH nicht standardisiert ist (aber Qualitats- 
richtlinien vorliegen), zeigen sich große Unterschiede bei der Prüferqualifi- 
zierung. Bei allen drei Institutionen gewinnt man „Prüfungssicherheit“ durch 
Erfahrung und das Beobachten der Kollegen und Kolleginnen. Eine profunde 
Qualifizierung erfolgt ausschließlich bei TestDaF. Dort zeigt die Befragung 
der Prüfenden, dass sie ausreichend auf unterschiedliche Facetten vorbereitet 
werden. Die Zufriedenheit mit der Qualifizierung ist ausgesprochen hoch. Bei 
der telc-Prüferqualifizierung liegen die Vermutungen bezüglich der Integration 
verschiedener Faktoren durch die Institution selbst und die Bewertung der 
Prüfenden weiter auseinander. Schwierig ist hier vor allem die sehr heteroge- 
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ne Vorbildung der „zukünftigen“ Prüfenden. Die Interviewten machten sehr 
deutlich, dass die Qualifizierung an sich sicherlich erfolgreicher ware, wenn 
die Vorbildung der Teilnehmenden ähnlich hoch wäre. Ferner wünschten sich 
alle Prüferinnen mehr Transparenz und ein ausführlicheres Feedback. Gerade, 
wenn keine DaF/DaZ-Qualifizierung gefordert ist, wäre zu überlegen, ob man 
zum einen das Vorwissen besser überprüft und zum anderen die Faktoren der 
Prüfungsverzerrung in die Qualifizierung integriert. Prüfende bei der DSH 
benötigen zwar inzwischen ein DaF-spezifisches Studium, dies wird aber si- 
cherlich noch nicht an allen Sprachenkollegs umgesetzt sein. Am ISSK Mainz 
haben jedoch die befragten Prüfenden alle ein spezifisches Studium und/oder 
sehr viel Erfahrung im Bereich DaF. Ein gezieltes Prüfungstraining fehlt. Die 
„Qualifizierung“ erfolgt durch Wissensweitergabe der „Prüfungsprofis“. Das 
ISSK Mainz überlegt aufgrund der Interviews, ob eine zusätzliche Weiterbil- 
dung nicht sinnvoll wäre. 
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Sprachliche Heterogenität und deren Einfluss 

auf das Hörverstehen in Sprachpriifungen - 

eine Vokalidentifikationsstudie mit Deutschlernenden 
und Deutschsprechenden 


Einleitung 


Hörverstehen stellt für Deutschlernende aufgrund von Faktoren wie der 
Textart, Aufgabenstellung und nicht zuletzt der Fähigkeiten der Lernenden 
eine große Herausforderung dar (vgl. Adamczak-Krysztofowicz & Limbach 
2019). Der vorliegende Artikel begutachtet die Vokalidentifikation als basale 
phonologische Erkennungsleistung von Deutschlernenden im Vergleich zu 
deutschen Muttersprachlerinnen und Muttersprachlern aus psycholinguisti- 
scher Perspektive. Hierfür wurde eine Identifikationsaufgabe mit Probandin- 
nen und Probanden durchgeführt, die entweder monolingual mit Deutsch 
aufgewachsen sind oder Deutsch mit mindestens einem Sprachniveau von GER 
B2 erlernt haben. Besonderes Augenmerk wird dabei auf Gruppenunterschie- 
de und Betrachtungen der Varianz der Testergebnisse gelegt. Ziel soll dabei 
unter anderem sein, den Einfluss zu betrachten, den unterschiedliche Sprach- 
hintergründe der Deutschlernenden auf das Ergebnis der Vokalidentifikation 
ausüben und daraus Perspektiven für Sprachunterricht und Sprachprüfungen 
zu entwickeln. 

Zu diesem Zweck wird zunächst die Lautverarbeitung bei Sprachlernenden 
und das Erlernen einer Fremdsprache aus psycho- und neurolinguistischer 
Perspektive dargelegt (Kapitel 1). Im Anschluss daran werden kurz die Her- 
ausforderungen des Hörverstehens in Prüfungen für Deutsch als Fremd- und 
Zweitsprache aus psycholinguistischer Sicht beleuchtet, um die Motivation der 
durchgeführten Studie zu verdeutlichen (Kapitel 2). Die vorliegende Studie zur 
Vokalidentifikation standarddeutscher Langvokale mitsamt den ihr zugrunde- 
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liegenden Forschungsfragen wird in Kapitel 3 erlautert. Hier werden wichtige 
Informationen zu den Probandengruppen (3.1) gegeben. Eine Beschreibung 
des Stimulusmaterials (3.2) sowie der allgemeinen Vorgehensweise folgen in 
Kapitel 3.3. Daraufhin werden die Daten analysiert und die Ergebnisse der Stu- 
die mit Hinblick auf die gewählten Maße dargelegt (3.4). Abschließend werden 
die Ergebnisse diskutiert und in den Kontext der Sprachprüfungen eingeordnet 
gefolgt von einem Ausblick im letzten Kapitel für weitere Untersuchungen, der 
Anregungen zur weiteren Kooperation zwischen Psycho-/Neurolinguistik und 
Sprachlehre bzw. Sprachprüfungen gibt. 


1 Psycho- und neurolinguistische Befunde 
zur Lautverarbeitung bei Sprachlernenden 


Im Rahmen der ersten IDS-Goethe-Studie von 2018, die sich mit Teilneh- 
menden von Sprachkursen für das Deutsche befasste, wurden Sprachbiogra- 
fien von 606 Teilnehmerinnen und Teilnehmern aus 42 Integrationskursen 
erstellt. Die Befragten gaben insgesamt 80 verschiedene Muttersprachen (L1) 
an, die sie in den ersten fünf Lebensjahren erwarben (vgl. Cindark et al. 2019; 
Hünlich et al. 2018). Es konnte daher eine beträchtliche Heterogenität sprach- 
licher Hintergründe beobachtet werden. Daraus folgt, dass in Sprachkursen 
und Sprachprüfungen auch eine Vielzahl unterschiedlicher Phoneminventare 
aufeinandertrifft. Entsprechend einer Studie von Best et al. (2001: 789-790) 
ist davon auszugehen, dass diese muttersprachlichen Phoneminventare jeweils 
als Basis für den Erwerb deutscher Sprachlaute fungieren. Die Forscherinnen 
und Forscher konnten zeigen, dass die Fähigkeit, Vokale einer Fremdspra- 
che zu unterscheiden, vom Sprachhintergrund abhängig ist. So wird bei der 
Perzeption nicht-muttersprachlicher Laute auf das Phoneminventar der Mut- 
tersprache zurückgegriffen. Die Versuchspersonen der Studie von Best et al. 
(2001) konnten in einer Diskriminationsaufgabe Laute besser unterscheiden, 
wenn die Lautkontraste denen ihrer L1 ähnelten. Nicht verwunderlich sind 
daher die Ergebnisse einer Untersuchung von Eckes (2013), die implizieren, 
dass die Erfolgswahrscheinlichkeit bei Hörverstehensaufgaben mit dem indi- 
viduellen Sprachhintergrund korreliert. Somit liegt nahe, dass der Erwerb von 
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Deutsch als Fremdsprache (L2') in Abhängigkeit von der Erstsprache der Ler- 
nenden unterschiedlich große Herausforderungen birgt. Motiviert durch die 
evidente Heterogenität in Sprachkursen wird in dieser Studie die Perzeption 
fremdsprachlicher Phoneme unter bewusster Einbeziehung von sprachlicher 
Divergenz und unter Berücksichtigung neuro- und psycholinguistischer Er- 
kenntnisse betrachtet. 

Allgemein gilt, dass Kleinkinder ihre Muttersprachen erwerben, indem sie 
dauerhaft mit ihnen im Kontakt sind. Bis zu einem Alter von etwa sechs Mona- 
ten sind Säuglinge prinzipiell in der Lage, Laute aller Sprachen zu perzipieren 
und zu differenzieren (vgl. Werker & Tees 1984a; Kuhl 2004). Studien zeigen, 
dass sich das Gehirn im Laufe des ersten Lebensjahres auf die Phoneme der 
Muttersprache oder Muttersprachen spezialisiert, bei gleichzeitiger Reduktion 
der Fähigkeit, nicht-muttersprachliche Laute zu identifizieren (vgl. Kuhl et al. 
1992; Werker & Tees 1984b). 

Nichtsdestoweniger besitzen natürlich auch Erwachsene die Fähigkeit, neue 
Sprachen zu erlernen. Eine Vielzahl von Studien zur Plastizität des mensch- 
lichen Gehirns zeigt, dass auch im Erwachsenenalter neuronale Strukturen 
angepasst werden können, um den Erwerb einer Fremdsprache zu gewährleis- 
ten (vgl. Costa & Sebastian-Gallés 2014; Golestani et al. 2006; Li et al. 2014; 
Osterhout et al. 2008; Sebastian-Gallés et al. 2012). Mittels bildgebender Ver- 
fahren wie der funktionellen Magnetresonanztomographie (fMRT) lässt sich 
dabei erkennen, dass sich das Gehirn zur Verarbeitung der L2 tendenziell am 
neuronalen Netzwerk der L1 bedient, also die gleichen Areale und Faserbah- 
nen verwendet werden, wobei jedoch zusätzliche Regionen aktiviert werden 
müssen (vgl. Marian et al. 2003; Parker Jones et al. 2012; Perani & Abutalebi 
2005; Sebastian et al. 2011; Sulpizio et al. 2020). Nicht etwa das Sprachniveau, 
sondern das Erwerbsalter scheint bei der Verarbeitung von Fremdsprachen 
eine entscheidende Rolle zu spielen. Genauer gesagt sprechen Analysen neu- 
ronaler Daten für Aktivierungen in mehr Regionen, wenn der Spracherwerb 
zu einem späteren Zeitpunkt stattfand (vgl. Gurunandan et al. 2019; Kim et al. 
1997; Liu & Cao 2016; Park et al. 2012). In neurolinguistischen Studien wurde 


1 Im Weiteren werden alle Fremdsprachen als L2 bezeichnet, ungeachtet der Reihenfolge, in 
der sie erworben wurden. 
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zudem der Einfluss der Muttersprache auf das Lernen einer Fremdsprache 
untersucht. Demnach konnten bei der Bearbeitung derselben Hörverstehens- 
aufgaben, Reimerkennungsaufgaben und lexikalischen Entscheidungsaufga- 
ben abhängig von der L1 der Teilnehmenden Aktivitäten in unterschiedlichen 
Hirnarealen beobachtet werden (vgl. Joeng et al. 2007; Kim et al. 2016; Yokoya- 
ma et al. 2013). Jedoch befassten sich die Forscherinnen und Forscher in erster 
Linie mit orthografischen und semantischen Fragestellungen, nicht explizit mit 
dem Einfluss der Distanz zwischen L1 und L2 auf Phonemebene. 

Wie Untersuchungen zur L2-Lautverarbeitung bei Erwachsenen mit Hil- 
fe von fMRT zeigen, können bereits bei geringen Fremdsprachkenntnissen 
Aktivierungsmuster erkannt werden, die der L1-Lautverarbeitung ähneln. So 
wiesen japanische Muttersprachlerinnen und Muttersprachler mit geringen 
Englischkenntnissen bei der Verarbeitung von Lauten des Englischen (über 
die das Japanische nicht verfügt) vermehrt Aktivierungen in Hirnarealen des 
auditorischen Kortex auf, die auch bei L1-Lautverarbeitung vorhanden wa- 
ren (vgl. Callan et al. 2004). Ein ähnliches Muster zeichnet sich nach kurzem 
Lautidentifikationstraining ab, bei dem englischsprachige Versuchspersonen 
unbekannte Laute des Hindi trainierten. Die Hirnareale waren in dieser Studie 
vor dem Training nicht aktiviert. Nach dem Training konnten jedoch ebenfalls 
Aktivierungen gefunden werden, die denen bei L1-Lautverarbeitung ähnelten 
(vgl. Golestani & Zatorre 2004). Zusätzlich konnte auch in diesen Studien be- 
obachtet werden, dass bei der Perzeption von nicht-muttersprachlichen Lauten 
mehr Regionen Aktivität aufwiesen als bei muttersprachlichen Lauten. Diese 
Ergebnisse lassen allerdings nur bedingt Rückschlüsse bezüglich des Einflusses 
der Ähnlichkeiten der beobachteten Sprachen, des wachsenden Sprachniveaus 
und dem Zeitpunkt des Spracherwerbs zu. 

Archila-Suerte et al. (2012, 2015) argumentieren auf Basis der Ergebnisse 
ihrer fMRT-Studien, dass nicht etwa das Sprachniveau, sondern insbesondere 
der Zeitpunkt des Spracherwerbs ausschlaggebend dafür ist, welche Regionen 
bei der Verarbeitung von L2-Lauten aktiviert werden. So postulieren sie (2015: 
46) eine stärkere Aktivierung des lobus parietalis inferior zur Identifikation 
von nicht-muttersprachlichen Lauten bei späten im Vergleich zu frühen Ler- 
nenden. Diese Areale werden mit selektiver Aufmerksamkeit assoziiert (vgl. 
Behrmann et al. 2004). Archila-Suerte et al. (2015: 46) vermuten daher, dass 
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späte Lernende diese Strategie implementieren, um den Einfluss der Mutter- 
sprache auf die Perzeption zu reduzieren und sich somit besser auf die Laute 
der L2 fokussieren zu können. 

Bei Betrachtung der behavioralen Ergebnisse von Archila-Suerte et al. 
(2012, 2015), Callan et al. (2004) und Golestani & Zatorre (2004) fällt auf, 
dass Laute einer erlernten Fremdsprache generell schwieriger zu identifizieren 
sind als die der Muttersprache. Dies stimmt mit zahlreichen weiteren For- 
schungsbefunden überein, wie z.B. mit denen einer Diskriminationsstudie 
(vgl. Flege 1995), bei welcher Muttersprachlerinnen und Muttersprachler ins- 
gesamt sechs verschiedener Muttersprachen (Arabisch, Deutsch, Koreanisch, 
Niederländisch, Portugiesisch, Spanisch) Vokale des Englischen unterscheiden 
mussten. Die Ergebnisse variierten je nach Muttersprache der Teilnehmen- 
den. Hierbei waren zwei englische Vokale dann schwieriger zu unterscheiden, 
wenn sie durch Assimilation entsprechend als verschiedene Tokens dessel- 
ben L1-Vokals identifiziert wurden. So fiel bspw. den deutschen Versuchs- 
personen die Unterscheidung des Kontrasts /e/-/&/ am schwierigsten, da im 
deutschen Phoneminventar nur der Vokal /e/, nicht aber /z/ vorhanden ist. 
In anderen Worten: Eine Diskrimination von fremdsprachlichen Lauten ist 
dann erschwert, wenn eine perzeptuelle Nähe zu einem muttersprachlichen 
Laut besteht oder die fremden Laute sogar innerhalb einer muttersprachlichen 
Lautkategorie liegen. Dies untermauert besonders den Einfluss der Mutter- 
sprache auf die Perzeption von L2-Lauten (vgl. Best & Tyler 2007; Faris 2017; 
Flege 2002, 2003; Flege et al. 1997; McAllister et al. 2002; Ohala 2008; Strange 
& Shafer 2008). Auch die Annahme, dass Laute der erlernten Sprache eher 
in Richtung der muttersprachlichen Phoneme assimiliert werden, wenn sie 
diesen ähneln (vgl. Best et al. 2001), kann bestätigt werden. Ein Experiment, 
dessen Teilnehmerinnen und Teilnehmer dialektale Unterschiede aufweisen, 
berichtet ähnliche Resultate. Während einer Kategorisierungsaufgabe hörten 
Sprecherinnen und Sprecher des holländischen und des westflämischen Dia- 
lekts der niederländischen Sprache die englischen Vokale /e/ und /z/, welche 
sie Phonemen des britischen Englisch zuordnen mussten. Die Dialektgrup- 
pen unterschieden sich in der Perzeption der fremdsprachlichen Vokale, wo- 
bei Sprecherinnen und Sprecher des holländischen Dialekts /e/ häufiger und 
/e/ seltener korrekt identifizierten als die westflamische Gruppe. Dies zeigt, 
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dass sich dialektale Differenzen ebenfalls in den Identifikationsleistungen der 
L2-Laute widerspiegeln (vgl. Escudero et al. 2012). 

Die von Archila-Suerte et al. (2012, 2015) formulierten Thesen zum Ein- 
fluss des Zeitpunkts des Spracherwerbs decken sich ebenfalls mit einer Studie 
von Flege & MacKay (2004). Dies geht aus dem Abschneiden zweier Gruppen 
italienischer Muttersprachlerinnen und Muttersprachler hervor, die im Schnitt 
seit drei Monaten oder seit 36 Jahren kanadisches Englisch sprachen (vgl. Flege 
& MacKay 2004). Bei der Diskrimination von L2-Vokalkontrasten schnitten 
die Spracherfahrenen besser ab als die Sprachunerfahrenen. Darüber hinaus 
erzielten Spracherfahrene, die angaben, ihre Muttersprache häufig zu verwen- 
den, signifikant schlechtere Ergebnisse als diejenigen, die angaben, selten Ita- 
lienisch zu sprechen. Folglich hat nicht nur die Länge des Aufenthalts und die 
Intensität des Sprachenlernens, sondern auch die Häufigkeit des Gebrauchs der 
L1 einen Einfluss auf die Perzeption von nicht-muttersprachlichen Vokalen. 

Schon Flege etal. (1997) fokussierten die Frage, inwiefern Spracherfahrung 
und Identifikationsleistung korrelieren. Im Rahmen einer Identifikationsauf- 
gabe mit Auswahlmöglichkeiten waren Muttersprachlerinnen und Mutter- 
sprachler des Deutschen, Spanischen und Koreanischen mit unterschiedlich 
guten Englischkenntnissen angewiesen, die englischen Vokale der Kontinua 
beat-bit (/i/-/1/) und bat-bet (/e/-/&/) zu identifizieren. Die Teilnehmenden 
sprachen außer Englisch keine weitere Fremdsprache. Neben Einflüssen der 
unterschiedlichen Muttersprachen fanden Flege et al. (1997) heraus, dass sich 
mit höherem L2-Sprachniveau auch die Identifikation der L2-Vokale verbes- 
sert. Zu ähnlichen Schlüssen kamen Bundgaard-Nielsen et al. (2011), wobei sie 
hervorheben, dass ein größeres Vokabular in der Fremdsprache mit konstante- 
rer Assimilation und besserer Diskrimination der L2-Vokale korreliert. Jedoch 
scheint der Effekt des wachsenden Vokabulars auf die Diskriminationsleistung 
ab einer Größe von etwa 6000 Wörtern nicht mehr zum Tragen zu kommen. 

Im Kontext von Sprachprüfungen und Sprachunterricht ist außerdem der 
Zusammenhang zwischen Produktion und Perzeption von L2-Lauten relevant. 
Studien belegen, dass Vokale differenzierter produziert werden, wenn sie auch 
genauer identifiziert und unterschieden werden (vgl. Flege et al. 1997, Perkell 
et al. 2004), d.h. das korrekte Hörverstehen hat Einfluss auf die Aussprache, in 
diesem Falle auf die Aussprache der Vokale. 
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Insgesamt heben die Beobachtungen hervor, wie essenziell der Faktor Zeit 
für den erfolgreichen Erwerb des Phoneminventars einer Zweitsprache ist. 
Kompetenzzuwachs und neuronale Restrukturierung der phonologisch rele- 
vanten Hirnareale scheinen hierbei Hand in Hand zu gehen. Zusätzlich zeigt 
sich, dass für erfolgreiches Hörverstehen basale perzeptive Prozesse notwendig 
sind. So bildet beispielsweise die phonologische Lauterkennung die Grund- 
voraussetzung für erfolgreiche Sprachperzeption. Darüber hinaus wurde auch 
die enge Verbindung von Sprachperzeption und -produktion veranschaulicht. 
Besonders deutlich wird jedoch in der Zusammenschau, dass aus psycho- und 
neurolinguistischer Perspektive der individuelle Sprachhintergrund einen der 
einflussreichsten Faktoren beim Fremdsprachenlernen darstellt, der in Sprach- 
prüfungen bislang eher vernachlässigt wird. Welche Rolle das Hörverstehen in 
Deutsch als Fremdsprache-Prüfungen genauer einnimmt, wird im folgenden 
Kapitel skizziert. 


2 Die Fertigkeit Hören in Prüfungen 
für Deutsch als Fremd- und Zweitsprache: 
Herausforderungen aus psycholinguistischer Sicht 


Das Studium an einer deutschen Hochschule setzt nachweisbare Deutsch- 
sprachkenntnisse auf dem Niveau C1 voraus. Ein solcher Nachweis kann 
erworben werden durch das erfolgreiche Absolvieren einer Sprachprüfung 
wie zum Beispiel TestDaF, DSH und telc Deutsch C1 Hochschule. Bestandteil 
dieser Prüfungen sind neben Leseverstehensaufgaben, der Produktion von 
schriftlichen Texten und dem mündlichen Prüfungsteil auch Aufgaben, die 
das Hörverstehen anhand von auditiv präsentierten Texten abfragen. Nach 
dem Gemeinsamen Europäischen Referenzrahmen für Sprachen bzw. dem 
neueren Begleitband von 2018 werden die globalen Fähigkeiten im Bereich 
Hörverstehen auf C1-Niveau wie folgt definiert: 


Can understand enough to follow extended speech on abstract and 


complex topics beyond his/her own field, though he/she may need to 
confirm occasional details, especially if the accent is unfamiliar. 
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Can recognise a wide range of idiomatic expressions and colloquialisms, 
appreciating register shifts. 

Can follow extended speech even when it is not clearly structured and 
when relationships are only implied and not signalled explicitly. (Coun- 
cil of Europe 2018: 55) 


Die Prüfungen setzen demnach insbesondere voraus, dass die Teilnehmenden 
über ein umfangreiches Vokabular verfügen und vermögen, Inhalte auf Basis 
ihres Kontexts zu verknüpfen. Diesen Fähigkeiten liegt zugrunde, dass die 
Geprüften sich der Phonologie des Deutschen bewusst sind und Wörter in 
gesprochener Sprache anhand ihrer Lautstruktur identifizieren können (vgl. 
Böttger 2016: 129). Aufeinem hohen Sprachniveau ist von einem großen Voka- 
bular und damit korrelierend von guten perzeptiven Kompetenzen auszugehen 
(vgl. Bundgaard-Nielsen et al. 2011). Nichtsdestoweniger geben die Ergebnisse 
der in Kapitel 1 vorgestellten neuro- und psycholinguistischen Studien Anlass 
zur Vermutung, dass der Sprachhintergrund der Teilnehmenden einen Einfluss 
auf deren Abschneiden im Bereich Hörverstehen hat. So lässt sich vermuten, 
dass weniger Überschneidungen des Phoneminventars von Muttersprache und 
erlernter Fremdsprache mit einem erhöhten Lernaufwand bezüglich der Vor- 
bereitung auf Hörverstehensaufgaben einhergehen. Dies wirft die Frage auf, 
ob die Teilnehmenden bei Sprachprüfungen abhängig von ihrem individuellen 
sprachlichen Hintergrund die gleichen Chancen auf Erfolg haben bzw. Sprach- 
prüfungen per se fair sein können. 

Am Beispiel der Qualitätssicherung des TestDaF zeigt sich bspw. ein 
ständiges Bestreben, Sprachtests zu optimieren und deren Validität zu ge- 
währleisten. Testentwicklung, Durchführung und Bewertung werden dabei 
für jede neu entwickelte Sprachprüfung empirisch erprobt (vgl. Eckes 2003, 
2005, 2008; Kecker 2016). Dazu werden unter anderem Methoden entworfen, 
die ermöglichen sollen, dass alle Teilnehmenden trotz Einschränkungen, 
wie zum Beispiel Blindheit, möglichst gleiche Chancen auf erfolgreiches 
Bestehen des TestDaF haben (vgl. Arras et al. 2013). Des Weiteren wird 
der Schwierigkeitsgrad jedes Tests so angepasst, dass die Aussagekraft der 
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Sprachniveaustufen konstant bleibt. Auch Variationen in der Bewertung, die 
aus der Strenge oder Milde der Prüferinnen und Prüfer resultieren, unterlie- 
gen stetiger Erprobung. Dadurch soll sichergestellt werden, dass tatsächlich 
die reine sprachliche Leistung der Teilnehmenden bewertet wird (vgl. Eckes 
2005). 

Doch aus diesem Grund gestaltet sich die Berücksichtigung des Sprach- 
hintergrundes bei der Bewertung komplex. Bedingt durch die sprachliche 
Heterogenität in Sprachkursen herrscht ein Ungleichgewicht bezüglich der 
Intensität der Vorbereitung für Sprachprüfungen. Da in Sprachprüfungen je- 
doch das Sprachniveau beurteilt wird, nicht aber der Lernaufwand, könnten 
Abweichungen der Evaluation, die aufgrund individueller Spracherfahrungen 
der Teilnehmenden erfolgen, die Aussagekraft des Sprachtests schmälern (vgl. 
Plassmann & Zeidler 2014: 239). 

Dieser Argumentation stehen nicht nur die Erkenntnisse aus psycho- und 
neurolinguistischen Studien gegenüber. Eckes (2013: 378) konnte bei einer 
Analyse der Prüfungsergebnisse des TestDaF zeigen, dass das Abschneiden 
der Prüflinge bei Hörverstehensaufgaben auf den Sprachhintergrund zurück- 
zuführen ist. In seinen Resultaten fasst der Autor die Teilnehmenden zu vier 
Gruppen zusammen: chinesische, koreanische, slawische und westeuropäi- 
sche Muttersprachlerinnen und Muttersprachler. Zwar ist diese Unterteilung 
typologisch unpräzise, dennoch konnten Unterschiede bezüglich des Hör- 
verstehens des Deutschen gefunden werden. Hierbei waren die Differenzen 
am ausgeprägtesten zwischen der chinesischen und slawischen Gruppe sowie 
zwischen der chinesischen und westeuropäischen Gruppe. Diese Tendenzen 
bestätigten sich in der Untersuchung eines weiteren TestDaF, der zu einem 
anderen Zeitpunkt durchgeführt wurde und dementsprechend andere Fragen 
beinhaltete. Dass in beiden Prüfungen Unterschiede bestehen, diese aber in 
der Stärke ihrer Ausprägung divergieren, macht deutlich, dass der Sprach- 
hintergrund die Leistung beeinflusst, was jedoch in der Prüfungskonzeption 
des TestDaF nicht kontrolliert wird. In Anbetracht der großen sprachlichen 
Heterogenität bei Sprachprüfungen könnten die Ergebnisse folglich dafür- 
sprechen, den Faktor Sprachhintergrund bereits bei der Prüfungskonzeption 
miteinzubeziehen. 
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Ebenso wie die Entwicklung einer Sprachpriifung kann die Lehre einen 
entscheidenden Einfluss auf die Chancengleichheit haben. Das wachsende Feld 
der Neurodidaktik untersucht unter anderem Strategien, wie der Sprachun- 
terricht von psycho- und neurolinguistischem Wissen profitieren kann (siehe 
bspw. Grein et al. 2020). Aktuell sehen die Lehrbiicher fiir das Erreichen des 
C1-Niveaus hinsichtlich der Vorbereitung auf Hörverstehensaufgaben in erster 
Linie Textverstehensübungen vor. Dies zeichnet sich zwar durch Prüfungs- 
nähe aus, vernachlässigt aber das Training der phonologischen Grundkennt- 
nisse (vgl. Marks 2015: 30). Wie bereits erwähnt, weist vieles darauf hin, dass 
die Hörverstehensleistungen von zunehmender phonologischer Kompetenz 
in der Fremdsprache profitieren (s. Kapitel 1). Ansätze der Neurodidaktik 
empfehlen daher, zusätzlich Übungen in die Lehre zu inkorporieren, die das 
Unterscheiden und Identifizieren von nicht-muttersprachlichen Sprachlauten 
trainieren (vgl. Böttger 2016: 127ff.). Ziel dieser Übungen ist es, die basalen 
phonologischen Fähigkeiten zu festigen, um schließlich auch die sprachliche 
Heterogenität eines Sprachkurses auszugleichen. Somit könnte eine Symbio- 
se von Sprachlernforschung und Neurodidaktik das Problem der Chancen- 
ungleichheit aufgrund unterschiedlicher Sprachhintergründe bereits in der 
Lehre minimieren. 

Obwohl die Vermutung naheliegt, dass die diskutierten Ansätze das Test- 
gütekriterium Fairness von Sprachprüfungen steigern, bedarf es noch einer 
Vielzahl empirischer Belege, damit die Optimierung von Prüfung und Lehre 
adäquat gestaltet werden kann. Die Durchführung einer Lautidentifikations- 
aufgabe (vgl. Dorman et al. 1985; Fry et al. 1962) mit einer sprachlich hetero- 
genen Gruppe erfahrener Deutschlernender eignet sich, um dies realitätsnah 
zu überprüfen. Da die Ergebnisse psycho- und neurolinguistischer Studien 
darauf hindeuten, dass selbst Deutschlernende mit hohem Sprachniveau grö- 
Bere Schwierigkeiten bei der Verarbeitung von deutschen Lauten aufweisen 
als Muttersprachlerinnen und Muttersprachler des Deutschen, sollten letztere 
als Vergleichsgruppe einer Studie herangezogen werden, die im Folgenden 
vorgestellt wird. 
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3 Identifikationsstudie 


In der vorliegenden Studie wurde ein Identifikationstest mit sechs deutschen 
Langvokalen durchgeführt. Im Vergleich zu einer Diskriminationsaufgabe (vgl. 
Gerrits & Schouten 2004; Norris et al. 2003; Polka & Bohn 2003), welche den 
Fokus auf das Unterscheiden von kontrastierenden Lauten legt, kann davon 
ausgegangen werden, dass das Testen der reinen Identifikationsleistung basale 
phonologische Fertigkeiten widerspiegelt (vgl. Fry et al. 1962; Schouten & van 
Hessen 1992). Die Aufgabe der Versuchspersonen bei einem Identifikationstest 
ist die Benennung der gehörten Vokale. Dadurch kann beobachtet werden, 
mit welchen phonologischen Repräsentationen die akustischen Signale der 
deutschen Vokale verknüpft sind. 

Die Anlage der hier vorliegenden Identifikationsstudie ist im psycholin- 
guistischen Sinne insofern ungewöhnlich, als dass der Sprachhintergrund der 
Sprachlernenden nicht kontrolliert wurde. Mit Kontrolle ist in diesem Zu- 
sammenhang gemeint, dass nicht gezielt Sprachlernende einer Sprache oder 
Sprachfamilie rekrutiert wurden, sondern bewusst eine heterogene Proband- 
engruppe gewählt wurde. Damit soll die Situation der Lehre und Prüfung für 
Deutsch als Fremd- oder Zweitsprache in der Untersuchung repräsentiert wer- 
den, da auch die Lern- und Prüfgruppen heterogene Muttersprachen besitzen 
(s. Ergebnisse der Goethe Studie, Kapitel 1). 

Auch deshalb ist bei dieser Studie der Vergleich von Deutschlernenden 
und Muttersprachlerinnen und Muttersprachlern interessant. Er erlaubt es, 
zu untersuchen, inwieweit sich die beiden Probandengruppen voneinander 
unterscheiden. Die beiden Maße, Akkuratheit und Fehlerart, sollen darüber 
hinaus auch Aufschluss darüber geben, ob es innerhalb der Untersuchungs- 
gruppen generell schwieriger zu identifizierende Vokale gibt. Im Gruppenver- 
gleich können zusätzlich noch Erkenntnisse darüber gewonnen werden, ob 
bestehende Schwierigkeiten eher universeller Natur sind oder ob sie mit der 
Spracherfahrung in Zusammenhang stehen. Dementsprechend lassen sich die 
Untersuchungsziele zweigeteilt betrachten: 


1. Es soll beobachtet werden, ob die Sprachlernenden generelle 
Schwierigkeiten mit der Identifikation von bestimmten deutschen 
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Langvokalen haben. Zur besseren Einschatzung der Effekte wird zu- 
satzlich eine Kontrollgruppe aus monolingualen Deutschsprechen- 
den erhoben. Durch den Gruppenvergleich können auch universell 
schwieriger oder einfacher zu identifizierende Vokale aufgedeckt 
werden. 

2. Durch die im psycholinguistischen Sinne ungewohnliche Hetero- 
genität der Sprachlernenden (vor allem in Bezug auf den Sprach- 
hintergrund) soll untersucht werden, ob sich diese auch in den Er- 
gebnissen widerspiegelt (z.B. hohe Varianz der Akkuratheit, Varianz 
der Fehlertypen). 


3.1 Teilnehmende 


Getestet wurden insgesamt 45 Studentinnen und Studenten sowie Mitarbei- 
terinnen und Mitarbeiter (34 weiblich, 11 männlich) der Johannes Guten- 
berg-Universitat Mainz. Davon bildeten 37 (27 weiblich, 10 mannlich) die 
Gruppe der monolingual Deutschsprachigen und sieben (6 weiblich, 1 mann- 
lich) die Gruppe der Deutschlernenden. Im Durchschnitt waren die Teilneh- 
menden tiber beide Gruppen hinweg 25,52 Jahre (SD 4,92), die Muttersprach- 
lerinnen und Muttersprachler des Deutschen 25,16 Jahre (SD 4,97) und die 
Deutschlernenden 27,43 Jahre (SD 4,43) alt. 

Fur die Gruppe der Muttersprachlerinnen und Muttersprachler galt die 
Voraussetzung, dass die Teilnehmerinnen und Teilnehmer monolingual mit 
Deutsch sozialisiert wurden. Fiir die Gruppe der Deutschlernenden wurde 
ebenfalls ein monolinguales Aufwachsen mit einer Muttersprache und darii- 
ber hinaus ein Deutsch-Sprachniveau von mindestens GER B2 vorausgesetzt. 
Von den sieben Deutschlernenden waren sechs nach Selbstauskunft auf Ni- 
veau C1 und eine Deutschlernende auf Niveau B2. Die Muttersprachen der 
Deutschlernenden waren Arabisch, Serbokroatisch, Usbekisch, Vietnamesisch, 
Koreanisch, Rumänisch und Chinesisch. Neben Deutsch waren bei ihnen am 
häufigsten die Fremdsprachen Englisch (7) und Russisch (3) vertreten. Die 
monolingual Deutschsprachigen verfügten über Kenntnisse in Englisch (37), 
Französisch (22), Spanisch (12), Schwedisch (6), Arabisch (4), Italienisch (3), 
Finnisch (3) und 12 weiteren Sprachen. 
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3.2 Material 


Für die Erhebung wurden je fünf Tokens der folgenden sechs deutschen Lang- 
vokale verwendet (Beispielwörter jeweils in Klammer): /o:/ (Boot), /u:/ (Hut), 
/e:/ (Bär), /e:/ (See), /o:/ (Löwe) und /y:/ (Süd). 

Bei Kontrolle der Auftrittsfrequenzen dieser deutschen Langvokale mit 
Hilfe der CELEX Datenbank (vgl. Baayen et al. 1995) konnten Aichert et al. 
(2005) folgende Rangfolge der hier gebrauchten deutschen Langvokale auf- 
stellen: Der Vokal /e:/ tritt im gewählten Korpus mit insgesamt 84.902 Er- 
scheinungen pro Million Wörter am häufigsten auf, gefolgt von /o:/ (52.854), 
/u:/ (38.132), /y:/ (21.076), /e:/ (11.295) und /e:/ (7.542). Die Kontrolle der 
Auftrittsfrequenz erfolgt, um den Effekt der Frequenz auf die Identifikations- 
ergebnisse einschätzen zu können. 

Da von jedem der sechs Langvokale fünf Tokens als Experimentalstimuli 
verwendeten wurden, beläuft sich die Gesamtzahl auf 30 Experimentalstimuli. 
Die Stimuli für die hier beschriebene Identifikationsaufgabe dienten bereits 
in zwei vorangehenden psycho- und neurolinguistischen Experimenten als 
Stimulusmaterial. Deshalb wurden die Langvokale von zwei phonetisch ge- 
schulten Sprecherinnen des Standarddeutschen eingesprochen, wobei eine 
Sprecherin die Laute /e:/, /o:/ und /y:/ und die andere Sprecherin die Laute 
/o:/, /u:/ und /e:/ einsprach. Die Aufnahmen erfolgten im Phonetiklabor der 
Philipps-Universität Marburg und im Neurolinguistics Lab der Johannes Gu- 
tenberg-Universität Mainz, jeweils in einer schallisolierten Kabine. Die Lang- 
vokale wurden isoliert und mit einer neutralen Intonation von den Sprecherin- 
nen produziert, um Koartikulations- und Intonationseffekte auszuschließen. 
Approximativ produzierten die Sprecherinnen insgesamt circa 40 Tokens pro 
Vokalkategorie. 

Im Anschluss daran wurden alle Vokalaufnahmen auf eine Länge von 400 
ms mit einem Fade-Out von 50 ms mittels der Software Praat (vgl. Boers- 
ma & Weenink 2019) geschnitten. Ihre Lautstärke wurde auf 70 dB im Mittel 
normalisiert. Die ersten und zweiten Formanten (Fl, F2) aller Aufnahmen 
wurden kontrolliert. Es wurden die Aufnahmen für das Experiment ausge- 
wählt, die den stabilsten Höreindruck hinterließen und deren Formanten bei 


© Frank & Timme Verlag für wissenschaftliche Literatur 285 


Joshua Ziegler & Miriam Riedinger 


geringer Varianz am geringsten von den Werten fiir standarddeutsche Vokale 
von Sendlmeier & Seebode (2006) abwichen (Abb. 1). 


F2 
2 500Hz 2 000Hz 1 500Hz 1 000Hz 500Hz 
200Hz 
x * 
xx x 
ag 
Vokale 
++ + 400Hz © /e:/ 
... ng a /e:/ 
ao. /o:/ 
+ /e:/ 
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* /y:/ 
A 600Hz 
& 
a 
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Abb. 1: Formantkarte der Stimuli. Darstellung der Lage der Vokale im Vokalraum anhand 
des ersten Formanten (F1) und des zweiten Formanten (F2). Vokalkategorien sind ohne 
Uberlappungen zu erkennen 


3.3 Vorgehen 


Die Stimuli wurden den Probandinnen und Probanden jeweils zwei Mal über 
Lautsprecher in pseudo-randomisierter Reihenfolge prasentiert, sodass sie ins- 
gesamt 60 Vokale horten. Kein Vokal trat mehr als zwei Mal hintereinander 
auf, um Pradiktions- und Gewohnungseffekte zu vermeiden. Die Testungen 
waren in vier Blöcke unterteilt, welche aus je 15 Aufnahmen bestanden. Um 
zusätzliche Reihenfolgeneffekte auszuschließen, wurden drei Listen erstellt, 
die in der Präsentationsreihenfolge der Blöcke variierten. Letztere wurden auf 
die Gruppen aufgeteilt. Nach der Hälfte der Stimuli wurde eine kurze Pause 
eingelegt. 

Durchgeführt wurde das Experiment in Gruppen von sechs bis zehn Ver- 
suchspersonen, die im Neurolinguistics Lab der Johannes Gutenberg-Uni- 
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versität Mainz gleichzeitig an der Paper-Pencil-Befragung teilnahmen. Die 
Versuchsleitung gewährleistete, dass die Teilnehmenden die Aufgabenstellung 
selbstständig und für sich allein lösten. Zusätzlich wurde sichergestellt, dass 
abgegebene Antworten nachträglich nicht mehr korrigiert wurden. Die Vokale 
wurden in einem langsamen Tempo nacheinander von der Versuchsleitung 
abgespielt, wobei darauf geachtet wurde, dass die Teilnehmenden genügend 
Zeit zum Notieren der jeweiligen Antworten hatten. 

Die Aufgabe der Probandinnen und Probanden war es, die gehörten Laute 
schriftlich festzuhalten. Damit die Teilnehmenden sich während des Experi- 
ments vollends auf die Identifikation der Laute konzentrieren konnten, wurden 
sie gebeten, auf eine phonemische Schreibweise zu verzichten und stattdessen 
auf die deutsche Orthografie zurückzugreifen. Vorgabe war hierbei eine gene- 
rische Graphem-Phonem-Entsprechung, die ohne genauere Erläuterung von 
allen Versuchspersonen verstanden wurde: /o:/ = <o>, /u:/ = <u>, /e:/ = <a>, 
le:/ = <e>, /o:/ = <ö> und /y:/ = <ü>. Abgesehen von dieser Instruktion hatten 
die Teilnehmer und Teilnehmerinnen keine Information darüber, welche Laute 
sie hören würden. 


3.4 Ergebnisse 


Wie bereits zuvor erwähnt, wurden in der Datenauswertung zwei Maße be- 
trachtet. Zum einen erfolgte eine Analyse der Akkuratheit (Prozent richtige 
Antworten) und zum anderen eine qualitative Untersuchung der Fehlerarten 
(welcher Laut wurde statt des richtigen identifiziert). 


3.4.1 Akkuratheit 


Zunächst wurden die Antworten der Teilnehmerinnen und Teilnehmer ausge- 
wertet. Für jede Versuchsperson wurde vermerkt, wie viele Aufnahmen sie pro 
Vokal richtig erkannt hatte. Auf Basis dessen konnte errechnet werden, zu wie 
viel Prozent die Laute im Durchschnitt korrekt zugeordnet wurden. Im Folgen- 
den wird das arithmetische Mittel in Prozent (Ø) als Maß der zentralen Tendenz 
untersucht. Dabei kann das Niveau des Mittelwertes Aussagen über die Güte der 
gemittelten Antworten zulassen. Hintergrund ist die Annahme, dass bei einem 
Prozentmittel von circa 50% davon ausgegangen werden muss, dass der Befund 
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nicht mehr systematisch, sondern zufällig ist. Zusätzlich zum Mittel wird auch 
die Standardabweichung in Prozent (SD) als Maß der Variabilität betrachtet. 
Wie in Tabelle 1 zu erkennen ist, konnten die Langvokale /o:/, /e:/, /e:/ und 
/o:/ über beide Gruppen hinweg zu mindestens 92,95% erkannt werden. Der 
mittlere Vokal /o:/ scheint mit einer Identifikationsrate von 99,55% (SD 2,11%) 
der Laut zu sein, der am fehlerfreiesten war. Die hohen Langvokale /u:/ und /y:/ 
hingegen weisen deutlich niedrigere Prozentwerte auf. Im Durchschnitt wur- 
de /u:/ zu 77,05% (SD 28,66) und /y:/ zu nur 67,73% (SD 34,23) identifiziert. 
Die hohen Standardabweichungen der zuletzt genannten Vokale im Vergleich 
zu /o:/ deuten darauf hin, dass dies auf Varianz zwischen den Versuchsper- 
sonen, aber auch zwischen den Gruppen zurückzuführen sein könnte. Die 
Standardabweichungen der Vokale /e:/, /e:/ und /o:/ weisen eine Streuung von 
mindestens 11,53% aufund haben somit ebenfalls eine höhere Varianz als /o:/. 


GESAMT /o:/ /u:/ le: /e:/ lo: Iy:l 
Ø (korrekt in %) 99,55 77,05 96,14 97,05 92,95 67,73 
SD (korrekt in %) 2,11 28,66 12,05 11,53 20,53 34,23 


Tabelle 1: Durchschnittliche Identifikationsleistungen (Ø) und Standardabweichungen (SD) 
über beide Gruppen hinweg 


Um die beiden Forschungsfragen (universell einfachere Vokale, Heterogenität 
der Ergebnisse als Folge der heterogenen Gruppen) beantworten zu können, 
werden in einem nächsten Schritt die Werte der beiden Gruppen (Mutter- 
sprachlerinnen/Muttersprachler, Deutschlernende) getrennt voneinander be- 
trachtet. Abbildung 2 veranschaulicht diesbezüglich nicht nur, dass die Vokale 
von den Sprachgruppen unterschiedlich oft passend notiert wurden, sondern 
auch, dass die Muttersprachlerinnen und Muttersprachler des Deutschen kon- 
stant besser abschnitten als die Deutschlernenden. Letztere ordneten im Mittel 
45,14 der 60 Vokale (75,24%) richtig zu, wobei die Gesamtzahl der richtigen 
Antworten pro Versuchsperson von 37 bis 58 reichte. Im Vergleich dazu iden- 
tifizierten die Monolingual Deutschsprachigen im Durchschnitt 54,54 von 60 
Langvokalen, was 90,90% der Stimuli entspricht. Die Anzahl der korrekt er- 
kannten Vokale reichte von 40 bis 60. 
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Abb. 2: Gruppenvergleich als Balkendiagramm. Prozentwerte der korrekten Antworten, 
getrennt nach Vokal und Gruppe (MD = Monolingual Deutschsprachige, DL = 
Deutschlernende) 


Genauer betrachtet zeigen die Ergebnisse der monolingual Deutschsprachigen 
einen Deckeneffekt bei den Lauten /o:/, /e:/, /e:/ und /o:/, welche allesamt zu 
mindestens 98,92% korrekt erkannt wurden (Tabelle 2). Die Standardabwei- 
chung liegt hierbei stets unter 3,15%. Zudem wurden die Langvokale /e:/ und 
/e:/ ausnahmslos fehlerfrei identifiziert. Wie sich ebenfalls in Tabelle 2 ab- 
zeichnet, hatten die Muttersprachlerinnen und Muttersprachler Probleme, die 
Laute /u:/ und /y:/ korrekt zu identifizieren. Der Mittelwert der Identifikation 
liegt für /u:/ bei 78,11%, für /y:/ bei 68,65%. Die Standardabweichungen von 
29,80% für /u:/ und 32,50% für /y:/ spiegeln wider, was ebenfalls in Abbildung 
3 zu erkennen ist: Innerhalb der Gruppe der monolingual Deutschsprachigen 
weichen die Identifikationsleistungen bezüglich der beiden Vokale zwischen 
den Teilnehmenden stark voneinander ab. Hier kann also konstatiert werden, 
dass scheinbar auch monolinguale deutsche Muttersprachler eine perzeptuelle 
Schwierigkeit mit den beiden Randvokalen /u:/ und /y:/ aufweisen, welche 
jedoch zwischen den Teilnehmenden zu schwanken scheint. Zwar wurde der 
hintere Langvokal /u:/ von 17 der 37 deutschen Teilnehmerinnen und Teilneh- 
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mern fehlerfrei erkannt, jedoch schafften dies sieben Versuchspersonen nur 
zu 50% oder weniger. In zwei Fragebögen wurde der Vokal durchweg nicht 
notiert, somit wurde hier /u:/ gar nicht erkannt. Den vorderen Langvokal /y:/ 
identifizierten nur 11 Probandinnen und Probanden zu 100%. Mehr als ein 
Drittel der monolingual Deutschsprachigen (13 von 37) hörten den korrekten 
Laut in höchstens 50% der Fälle, wiederum zwei von ihnen erkannten ihn nie. 
Es konnte keine Korrelation zwischen den beherrschten Fremdsprachen und 
der Identifikationsleistung festgestellt werden. 


MD /o:/ lu:/ /e:/ /e:/ lo: ly:/ Total 
Ø (korrekt in %) 99,72 78,11 100 100 98,92 68,65 90,90 
SD (korrekt in %) 1,64 29,80 0 0 3,15 32,50 8,92 


Tabelle 2: Durchschnittliche Identifikationsleistungen (Ø) und Standardabweichungen (SD) 
der monolingual Deutschsprachigen (MD) 
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Abb. 3: Identifikationsleistungen (in %) der monolingual Deutschsprachigen, aufgeteilt nach 
Vokal und Versuchsperson 
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Ähnlich der Kontrollgruppe konnten die Deutschlernenden /o:/ zu 98,57% (SD 
3,78%) weitgehend problemlos benennen (Tabelle 3). Während die deutschen 
Muttersprachler und Muttersprachlerinnen beim mittleren Langvokal /e:/ und 
beim Vokal /e:/ einen Deckeneffekt aufwiesen, zeigten die Deutschlernenden 
hier etwas schlechtere Identifikationsleistungen. Der Langvokal /e:/ wurde in 
81,43% (SD 24,78), /e:/ in nur 75,14% (SD 21,49) der Fälle erkannt. Ähnlich 
schwierig gestaltete sich die Identifizierung des Vokals /u:/. Die Deutschler- 
nenden konnten hier nur in 71,43% (SD 22,68) der Fälle den Vokal richtig 
identifizieren. Auffällig ist an dieser Stelle, dass in der Gruppe der Deutsch- 
lernenden /o:/ ebenfalls der am einfachsten auszumachende Vokal zu sein 
scheint. Die Vokale /e:/, /e:/ und /u:/ wurden im Vergleich dazu schlechter 
erkannt. Dementsprechend zeigten die Deutschlernenden hier auch eine grö- 
ßere Varianz der Leistung. 


DL /o:/ /u:/ le: /e:/ lo: Iy:l Total 
Ø (korrekt in %) 98,57 71,43 75,14 81,43 61,43 62,86 75,24 
SD (korrekt in %) 3,78 22,68 21,49 24,78 39,76 44,99 11,52 


Tabelle 3: Durchschnittliche Identifikationsleistungen (Ø) und Standardabweichungen (SD) 
der Deutschlernenden (DL) 


Die Umlaute /ø:/ und /y:/ weisen mit 61,43% respektive 62,86% die schlech- 
testen Identifikationsleistungen auf. Unter der Annahme eines Zufallsniveaus 
der Antworten bei circa 50% sind diese Ergebnisse ebenfalls auffällig. Darüber 
hinaus lässt sich auch hier eine hohe Varianz der Erkennungsleistung zwischen 
den Teilnehmenden erkennen (Abb. 4). Die Standardabweichungen liegen bei 
39,76% für /o:/ und 44,99% für /y:/. Drei Versuchspersonen identifizierten 
den Langvokal /o:/ nur in höchstens der Hälfte der Fälle. Von einer dieser 
drei Versuchspersonen wurde er zu 0% erkannt. Als Muttersprachen gaben 
sie Arabisch (Damaskus), Serbokroatisch und Chinesisch (Chengdu) an. Der 
Langvokal /y:/ wurde von zwei Deutschlernenden konstant nicht notiert. Es 
handelt sich hierbei um Muttersprachlerinnen und Muttersprachler des Ru- 
mänischen und des Koreanischen. Die restlichen fünf Teilnehmerinnen und 
Teilnehmer identifizierten den hohen Langvokal zu mindestens 50%. 
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Abb. 4: Identifikationsleistungen (in %) der Deutschlernenden, aufgeteilt nach Vokal und 
Versuchsperson 


Zusammenfassend zeigt sich, dass die deutschen Muttersprachler und Mut- 
tersprachlerinnen in der Identifikationsleistung insgesamt besser abschneiden 
als die Deutschlernenden. Ferner scheinen auch auf einem hohen Sprachni- 
veau (überwiegend C1) Sprachlernende bei basalen phonologischen Aufgaben 
Schwierigkeiten zu haben. Es lässt sich jedoch auch festhalten, dass sich der 
Laut /o:/ den Ergebnissen beider Gruppen nach als universell leicht zu identi- 
fizierender Vokal abzeichnet. Auch /e:/ und /e:/ können als universell weniger 
problematische Vokale identifiziert werden, da hier sowohl die Deutschspra- 
chigen als auch die Deutschlernenden akzeptable Identifikationsleistungen 
aufweisen. Im Gegenzug bereitet die Identifizierung der Vokale /u:/ und /y:/ in 
beiden Untersuchungsgruppen größere Probleme. Für die Deutschlernenden 
zusätzlich problematisch war der Laut /ø:/. Im Hinblick auf die Varianz der 
Antworten pro Probandengruppe und Vokal weist die Gruppe der Deutschler- 
nenden außer bei /o:/ eine hohe Varianz im Antwortverhalten auf. Besonders 
die Vokale /ø:/ und /y:/ sind hier auffällig. Im Gegensatz dazu zeigt die Gruppe 
der Deutschsprachigen nur bei /u:/ und /y:/ eine höhere Varianz. Dement- 
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sprechend kann festgehalten werden, dass sich die Heterogenität der Gruppe 
der Sprachlernenden in Bezug auf ihre Sprachbiografie in den Ergebnissen 
widerzuspiegeln scheint. 


3.4.2 Fehlerart 


Ein genauer Blick auf die falsch perzipierten Laute ermöglicht es, differen- 
ziertere Aussagen über die Identifikationsleistungen zu treffen. Bezüglich der 
Gruppe der monolingual deutschsprachigen Versuchspersonen zeigt sich, dass 
/u:/ in 21,62% der Fälle als /o:/ identifiziert wurde (Tabelle 4). Der umgekehrte 
Fall trat nicht ein. Die Langvokale /y:/ und /o:/ hingegen wurden in beide Rich- 
tungen miteinander verwechselt. Dabei zeigt sich eine deutliche Asymmetrie 
zugunsten der Identifikation von /y:/ als /o:/. Zu 31,35% identifizierten die 
Teilnehmerinnen und Teilnehmer /y:/ als /ø:/. Allerdings hörten nur 0,81% 
den Langvokal /o:/ als /y:/. 


Stimulus /u:/ /o:/ ly:/ lo: 
Fehler /o:/ lo: /m/ /9:/ ly:/ /o:/ 
% 21,62 0,27 0,27 31,35 0,81 0,27 


Tabelle 4: Fehlerarten der monolingual Deutschsprachigen. Häufigkeit (in %), zu der ein 
Stimulus mit einem anderen Laut (Fehler) verwechselt wurde 


Darüber hinaus identifizierten je eine Versuchsperson einmalig /u:/ als /o:/ 
und /o:/ als /o:/, was jeweils 0,27% der Fehler des entsprechenden Stimulus 
entspricht. Ebenfalls einmalig notierte eine Versuchsperson den Buchstaben 
<m> nach Präsentation von /o:/. Da es sich um den ersten Stimulus handelte, 
den die Person hörte, ist davon auszugehen, dass der Fehler durch Unaufmerk- 
samkeit bedingt war. Die in diesem Abschnitt genannten Fehler wiederholten 
sich weder innerhalb des Fragebogens einer Versuchsperson noch bei anderen 
Teilnehmenden aus der Gruppe der Deutschsprachigen und sind demnach zu 
vernachlässigen. 

Gegenüber der geringen Anzahl der Fehlervarianten der Muttersprach- 
lerinnen und Muttersprachler des Deutschen zeichnet sich bei den Deutsch- 
lernenden ein komplexeres Bild ab (Tabelle 5). So wurde /u:/ zu 24,29% als 
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/o:/ identifiziert, was in etwa dem Wert der Monolingual Deutschsprachigen 
entspricht. Zusätzlich hörten die Deutschlernenden in 2,86% der Fälle /y:/ 
statt /u:/. In einem Fall (entspricht 1,43%) konnte /u:/ gänzlich nicht einem 
Laut der deutschen Sprache zugeordnet werden. Dass /o:/ als /u:/ identifiziert 
wurde, lässt sich nur ein einziges Mal beobachten. In beiden Gruppen scheint 
die Verwechslung von /u:/ und /o:/ somit weitestgehend unidirektional zu 


sein. 

Stimulus /u:/ /o:/ Iy: /9:/ le: /e:/ 
Fehler lo:/ | ly:/ | = | ful | fol | fal | ly: | fo:l | fuel | fel | fa | fest | fi: 
% 24,29 | 2,86 | 1,43 | 1,43 | 31,43 | 5,71 | 22,86) 7,14 | 8,57 | 22,86) 1,43 | 12,85] 5,71 


Tabelle 5: Fehlerarten der Deutschlernenden. Häufigkeit (in %), zu der ein Stimulus mit 
einem anderen Laut (Fehler) verwechselt wurde 


Auch die durchschnittliche Häufigkeit, mit der /y:/ als /o:/ notiert wurde, 
stimmt mit 31,43% mit den Ergebnissen der Deutschsprachigen überein. Die 
Deutschlernenden hörten /y:/ zusätzlich zu 5,71% als /u:/. Weniger eindeutig 
als in der Gruppe der deutschen Muttersprachlerinnen und Muttersprachler 
ist die Asymmetrie von /y:/ und /o:/. 22,68% der präsentierten /o:/ wurden 
von den Deutschlernenden als /y:/ identifiziert. Zudem notierten die Ver- 
suchspersonen dieser Gruppe in 7,14% der Fälle /o:/ und in 8,57% /u:/ statt 
lol. 

Des Weiteren schienen die Nicht-Muttersprachlerinnen und Nicht-Mut- 
tersprachler die Langvokale /e:/ und /e:/ miteinander zu verwechseln. Auch 
hierbei herrscht Asymmetrie, da /e:/ zu 22,86% als /e:/ und /e:/ zu 12,85% als 
/e:/ identifiziert wurde. Der Vokal /e:/ wurde zusätzlich in einem Fall (1,43%) 
als /a:/ notiert. Der Stimulus /e:/ wurden in 5,71% der Male als /i:/ gehört. 

Insgesamt lässt sich erkennen, dass in erster Linie die hohen Vokale /u:/ 
und /y:/ Probleme bei der Identifikation bereiten. Diese wurden hauptsächlich 
mit den mittleren deutschen Vokalen verwechselt, die ihnen im Vokalraum 
benachbart sind, die also ähnliche F2-Werte und höhere F1-Werte aufweisen 
(Abb. Formantkarte in Kapitel 3.2). Hier findet sich auch die größte Varianz 
zwischen den Versuchspersonen der jeweiligen Gruppen. Im Gruppenver- 
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gleich fällt auf, dass die Deutschlernenden neben der prävalenten Fehliden- 
tifikation von /o:/ statt /u:/ und /ø:/ statt /y:/ auch mehr Fehlervariationen 
aufweisen als die Deutschsprachigen. 


4 Diskussion und Ausblick 


Wie zu Beginn des Artikels in Kapitel 1 beschrieben, hat die Muttersprache aus 
psycho- und neurolinguistischer Perspektive einen entscheidenden Einfluss auf 
das Fremdsprachenlernen und damit auch auf die Leistungen der Lernenden. 
Jedoch wird bei Leistungsbeurteilungen von Sprachprüfungen der Einfluss 
der Muttersprache nicht explizit als Bewertungskriterium berücksichtigt (vgl. 
Eckes 2005). Die Tatsache, dass der Sprachhintergrund der Prüflinge nicht in 
die Bewertung mit einbezogen wird, liegt daran, dass nicht der Lernaufwand, 
sondern das Sprachniveau bewertet wird (vgl. Plassmann & Zeidler 2014: 239). 
Aus psycholinguistischer Perspektive ist dieses Vorgehen kritisch zu betrach- 
ten, da viele Studien in den letzten Jahrzehnten nachweisen konnten, dass die 
Muttersprache einen entscheidenden Einfluss auf das Fremdsprachenlernen 
und die Lauterkennung hat (vgl. z.B. Best & Tyler 2007; Flege 2002, 2003; 
Strange & Shafer 2008). Dabei wurde auch gezeigt, dass fremdsprachliche Lau- 
te, die einer L1-Lautkategorie ähnlich sind, schwieriger zu unterscheiden sind 
als Laute, die keine Ähnlichkeit mit einem muttersprachlichen Laut aufweisen 
(vgl. Flege 1995). Aus didaktischer Sicht scheint die Nichtberücksichtigung 
des Sprachhintergrundes der Prüflinge demzufolge insofern problematisch, 
als hier ein Ungleichgewicht in den Erfolgschancen bestehen kann. Durch die 
enge Verknüpfung von Sprachperzeption und -produktion (vgl. z.B. Flege et 
al. 1997) beim Fremdsprachenlernen schlägt sich diese Chancenungleichheit 
nicht nur in Hörverstehens- sondern auch in Produktionsaufgaben nieder. 
Eine Anpassung der Prüfungsvorbereitung und -konzeption hinsichtlich der 
Berücksichtigung des sprachlichen Hintergrundes könnte zu mehr Chancen- 
gleichheit und Fairness in Prüfungssituationen führen. 

Deshalb hatte die vorliegende Studie zum Ziel, den Einfluss der sprach- 
lichen Heterogenität auf die Erkennungsleistung (nicht-muttersprachlicher) 
deutscher Langvokale zu untersuchen. Hierzu wurde eine heterogene Gruppe 
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Deutschlernender sowie eine Gruppe Deutschsprechender untersucht. Die 
Deutschlernenden hatten in etwa das gleiche Sprachniveau, die Muttersprache 
der Teilnehmenden wurde zwar erfasst, diente jedoch nicht als Ausschluss- 
kriterium. Daraus resultiert eine heterogene Gruppenzusammensetzung der 
Deutschlernenden mit sehr unterschiedlichen Herkunftssprachen. Aus diesem 
Grund lässt sich ein Vergleich zwischen den Ergebnissen der Studie und der 
realen Lehr- und Prüfungssituation ziehen. Aufgabe der Teilnehmenden war 
es, 60 Hörbeispiele sechs verschiedener standarddeutscher Langvokale rich- 
tig zu identifizieren. Hierbei wurden zwei Maße, Akkuratheit und Fehlerart, 
betrachtet und sowohl innerhalb der Teilnehmergruppen als auch im Grup- 
penvergleich analysiert. Übergeordnet lässt sich zunächst, wie vorhergesagt, 
feststellen, dass die Identifikationsleistung der Muttersprachlerinnen und Mut- 
tersprachler bei allen Vokalen über den Leistungen der Deutschlernenden liegt. 
Tiefergehend sollte die Studie jedoch zwei Forschungsfragen beantworten: 


1. Gibt es Laute, die generell einfacher oder schwieriger zu erkennen 
sind? 

2. Ist die Heterogenität der Sprachlernenden im Ergebnis der Identi- 
fikationsleistung erkennbar? 


In Bezug auf die erste Forschungsfrage zeichnet sich ab, dass drei der unter- 
suchten sechs Laute generell einfacher bzw. schwieriger zu benennen sind. 
Diese Befunde werden dadurch gestützt, dass die Ergebnisse beider Sprach- 
gruppen, sowohl Deutschsprechende als auch Deutschlernende, ähnlich hohe 
oder niedrige Identifikationsleistungen bei bestimmten Lauten aufweisen. Bei- 
spielsweise scheint der Langvokal /o:/ leichter zu identifizieren zu sein als die 
anderen Vokale. In beiden Sprachgruppen lag die Akkuratheit bei fast 100 
Prozent. Zusätzlich dazu scheinen die Langvokale /u:/ und /y:/ generell per- 
zeptiv schwieriger zu identifizieren sein, da hier beide Sprachgruppen ähnlich 
niedrige Akkuratheitsraten erreichten. Die korrekte Erkennung des Langvo- 
kals /y:/ scheint die größte Herausforderung zu sein. Ungewöhnlich an diesem 
Befund ist, dass der mittlere Langvokal /o:/ leichter zu erkennen ist als die 
hohen Vokale /u:/ und /y:/. Im Gegensatz zu den vorliegenden Ergebnissen 
zeigte sich in behavioralen Studien mit Sprachlernenden, dass Randvokale 
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im Vokalraum aufgrund ihrer prägnanten akustisch-artikulatorischen Eigen- 
schaften perzeptuell leichter zu verarbeiten sind (vgl. z.B. Polka & Bohn 2011). 
Warum bei der vorliegenden Studie die Erkennungsmuster umgekehrt sind, 
kann zu diesem Zeitpunkt nicht abschließend geklärt werden und bedarf daher 
weiterer Untersuchungen. 

Bezüglich der zweiten Forschungsfrage kann konstatiert werden, dass die 
Heterogenität des Sprachhintergrundes bei den Sprachlernenden einen Einfluss 
auf die Identifikation deutscher Langvokale zu haben scheint. Mit Blick auf die 
Akkuratheit der Erkennung der Vokale /e:/ und /e:/ zeigt sich, dass die Sprach- 
lernenden bei beiden Vokalen unter gleichzeitiger hoher Varianz der indivi- 
duellen Ergebnisse eine schlechtere Leistung aufweisen als die muttersprachli- 
chen Teilnehmenden. Die höhere Varianz könnte hierbei für einen Einfluss des 
Sprachhintergrundes sprechen. Ein ähnliches, noch deutlicheres Bild zeichnet 
sich bei /o:/ ab. Während auch hier die muttersprachlichen Probandinnen und 
Probanden über eine sehr hohe Identifikationsleistung verfügen, fällt die Leis- 
tung der nicht-muttersprachlichen Deutschlernenden deutlich ab. Zugleich 
zeigt sich hierbei erneut eine hohe individuelle Varianz. Insgesamt kann darüber 
hinaus festgehalten werden, dass die heterogene Gruppe der Deutschlernenden 
bei fünf der sechs getesteten Vokale eine deutliche höhere Zwischensubjektva- 
rianz aufweisen als die deutschen Muttersprachlerinnen und Muttersprachler. 
Diese erhöhte Varianz der Leistungen spricht für einen Einfluss der jeweiligen 
Muttersprache auf die Identifikation nicht-nativer Vokale. 

Auch die Analyse der Fehlerarten zeigt einen Einfluss der Heterogenität 
des sprachlichen Hintergrunds bei der Gruppe der Deutschlernenden auf die 
Identifikationsleistung. Während die Gruppe der monolingual Deutschspre- 
chenden nur wenige und sehr begrenzte Fehlertypen zeigt, ist das Bild in der 
Gruppe der Deutschlernenden deutlich diverser. Insgesamt fällt für die Letz- 
tere auf, dass mehr und unterschiedliche Fehler gemacht werden. Darüber 
hinaus unterscheiden sich die Fehlertypen oftmals von denen der Deutsch- 
sprechenden. Diese Feststellungen treffen insbesondere für die Laute /u:/, /e:/, 
/e:/, /y:/ und /o:/ zu. Auch diese Diversität und die veränderten Fehlerarten 
im Vergleich zu denen aus der Gruppe der Deutschsprechenden lassen auf 
einen Einfluss der jeweiligen Muttersprache hinsichtlich der Erkennungsleis- 
tung schließen. 
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Zusammenfassend lasst sich festhalten, dass es sowohl Laute zu geben 
scheint, die fiir beide Sprachgruppen generell einfach oder schwieriger zu 
identifizieren sind, als auch, dass die Heterogenitat des Sprachhintergrunds 
bei Deutschlernenden einen Einfluss auf die Ergebnisse der Erkennungsleis- 
tung hat. 

Die vorliegende Untersuchung stellt eine psycholinguistische Pilotstudie 
dar und lässt daher an einigen Punkten Fragen offen. Wie bereits erwähnt, ist im 
Moment nicht zu erklären, weshalb Vokale der mittleren Zungenhöhe sowohl 
von Muttersprachlerinnen und Muttersprachlern als auch von Deutschlernen- 
den leichter zu identifizieren waren als hohe Vokale. Durch die unterschiedliche 
Größe der beiden Sprachgruppen ergeben sich ebenfalls Limitationen. Gerade 
die Gruppe der Deutschlernenden war mit sieben Teilnehmenden verhältnis- 
mäßig klein. Daher würde sich eine weitere Untersuchung mit einer größeren 
Probandengruppe an Deutschlernenden empfehlen. Zusätzlich könnten auch 
erneute Testungen mit gezielt kontrollierten Muttersprachen sinnvoll sein, um 
den Einfluss von bestimmten Muttersprachen auf die Erkennung verschiede- 
ner deutscher Vokale noch besser nachvollziehen zu können. Strange & Shafer 
(2008) führten darüber hinaus an, dass eine Benennung mittels orthografischer 
Antwort nicht ausreichend repräsentativ ist, besonders dann, wenn die Teil- 
nehmenden nicht über ein ausreichend hohes Sprachniveau verfügen. Obwohl 
in der vorliegenden Studie die Probandinnen und Probanden mindestens ein 
Sprachniveau von B2 hatten und daher angenommen werden kann, dass die 
Aufgabe den Teilnehmenden keine Probleme bereitete, könnte sich bei erneu- 
ten Untersuchungen eine Anpassung der Aufgabenstellung anbieten. Denkbar 
wäre hier beispielsweise eine Zuordnungsaufgabe, bei der Grapheme angezeigt 
werden, die dem jeweiligen Laut zugeordnet werden müssen. Zusätzlich dazu 
könnte eine Anpassung der Präsentation der Laute vorgenommen werden. 
Die isolierte Präsentationsweise ist für die Teilnehmenden eine ungewöhnli- 
che und unnatürliche Perzeptionssituation. Wie Studien zeigen konnten, wird 
die Erkennung phonologischer Repräsentationen nicht nur mit zunehmen- 
der Größe des Vokabulars (vgl. Bundgaard-Nielsen et al. 2011) erleichtert, 
sie ist auch insgesamt kontextabhängig. Es wurde erwiesen, dass sich Vokale 
einfacher identifizieren lassen, sobald diese von Konsonanten umgeben sind 
(vgl. z.B. Strange et al. 1979; Rakerd 1984). Aus diesem Grund könnte sich 
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bei weiteren Studien eine syllabische Präsentationsweise der Laute (z.B. /tu:/) 
anbieten. Insgesamt wären auch Untersuchungen mittels Pseudowörtern oder 
Minimalpaaren interessant, um die Untersuchung zusätzlich in einer natürli- 
cheren Perzeptionssituation durchzuführen. 

Trotz der genannten Limitationen liefert die vorliegende Studie Eviden- 
zen für den Einfluss der Heterogenität des sprachlichen Hintergrunds auf die 
phonologischen Erkennungsleistungen. Bedingt durch diese sprachliche Di- 
versität werden demnach die verschiedenen Teilnehmerinnen und Teilnehmer 
vor unterschiedliche Herausforderungen im Aufgabenkontext gestellt. Gestützt 
durch psycho- und neurolinguistische Erkenntnisse (siehe Kapitel 1) ist daher 
jedoch auch anzunehmen, dass damit ebenfalls unterschiedliche Herausforde- 
rungen beim Fremdsprachenlernen einhergehen. Besonders auffällig an die- 
ser Identifikationsstudie war, dass selbst monolinguale Deutschsprecherinnen 
und Deutschsprecher bei einigen Lauten erhebliche Schwierigkeiten mit der 
korrekten Erkennung der Laute hatten. Dies zeigte sich einmal durch niedri- 
gere Akkuratheit, aber auch durch hohe individuelle Varianzen in den Erken- 
nungsleistungen (z.B. /y:/). Wenn selbst muttersprachlich Deutschsprechende 
Schwierigkeiten bei dieser Aufgabe haben, so ist es nicht verwunderlich, dass 
Deutschlernende mit heterogenen sprachlichen Hintergründen hier besondere 
Schwierigkeiten und noch größere individuelle Varianz aufzeigen. 

Aus diesem Grund könnte eine direkte Berücksichtigung der Herkunfts- 
sprachen bei der Bewertung von Sprachprüfungen sinnvoll sein. Durch Einbe- 
ziehung des Sprachhintergrunds in die Leistungsbeurteilung könnte eine noch 
größere Chancengleichheit bzw. Fairness der Sprachprüfungen erzielt werden. 
Da Sprachprüfungen jedoch das Sprachniveau unabhängig vom Sprachhinter- 
grund bewerten sollen, wäre eine nachträgliche Korrektur der Prüfungsergeb- 
nisse für den jeweiligen Sprachhintergrund nicht zielführend. Vielmehr könnte 
es beispielsweise sinnvoll sein, Lauterkennungsaufgaben auch in den Prüfungs- 
kontext mit einzubeziehen. Wenn in Prüfungen diese immanenten Schwierig- 
keiten miterhoben werden, könnte bei Nichtbestehen der Hörverstehens- und 
Sprachproduktionsaufgaben anhand dieser Daten überprüft werden, ob dies 
nicht auf die Lernleistungen, sondern auf den Sprachhintergrund zurückzu- 
führen ist. Denkbar wäre, den Prüfungsteilnehmenden eine Wiederholung des 
Hörverstehens, da in den Prüfungen auf höherem Niveau eine Wiederholung 
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der ganzen Prüfung unabhängig des vorherigen Ergebnisses die Regel ist, zu 
ermöglichen. So könnte in der Vorbereitung auf eine Prüfungswiederholung 
der Fokus auf die Lauterkennung und Aussprache gelegt werden, um die Chan- 
cen auf erfolgreiches Bestehen zu erhöhen. 

Offensichtlich ist aber auch, dass die Berücksichtigung des Sprachhinter- 
grundes selbst Herausforderungen mit sich bringt. Aus diesem Grund bietet 
sich aus psycho- und neurolinguistischer Sicht eine verstärkte Fokussierung auf 
gezielte Trainingseinheiten in der Lehre und in der Prüfungsvorbereitung an. 
Die Lauterkennung ist eine Grundfertigkeit, die darüber hinaus positiv mit der 
Lautproduktion korreliert. Während Böttger (2016) beim frühen Fremdspra- 
chenlernen gezielte Lauterkennungsübungen vorschlägt, kann aus psycho- und 
neurolinguistischer Sicht argumentiert werden, dass diese basalen Fertigkeiten 
auch bei höherem Sprachniveau gezielt trainiert werden sollte. Wie zahlreiche 
Studien zeigten, ist nicht nur das korrekte Lernen von nicht-nativen Lauten im 
Erwachsenenalter möglich (vgl. Golestani & Zatorre 2009; Logan et al. 1991; 
MacKain et al. 1981), durch die gezielte Übung der perzeptiven Fähigkeiten 
wird gleichzeitig auch die korrekte Produktion gefördert (vgl. z.B. Perkell et 
al. 2004). 

Zusätzlich konnten einige Studien gezielte Trainingseffekte sowohl auf 
behavioraler als auch auf neuronaler Ebene zeigen. Iverson et al. (2011) tes- 
teten in einer behavioralen Studie die Identifikations- und Diskriminations- 
fähigkeit vor und nach gezielten Identifikationstrainingseinheiten. Sie fanden 
eine signifikant bessere Identifikationsleistung nach Absolvierung gezielter 
Übungsperioden mit gleichzeitig geringen Verbesserungen in der Lautdiskri- 
mination und -produktion. Ähnliche Befunde konnten in weiteren Studien 
mit unterschiedlichen Lauten aus verschiedenen Sprachen reproduziert wer- 
den (vgl. Golestani & Zatorre 2008; Shinohara & Iverson 2018). Auch neuro- 
nal wirkt sich gezieltes und wiederholtes Training positiv auf die Erkennung 
und Verarbeitung von Lauten aus. So kommt es durch wiederholte Übungen 
zu veränderten Aktivierungen im Gehirn. Golestani & Zatorre (2004) etwa 
konnten zeigen, dass ohne Übungen nur Areale nicht-nativer Lautverarbeitung 
aktiviert werden, während im Anschluss an Übungseinheiten nach und nach 
auch Areale muttersprachlicher Lautverarbeitung mit aktiviert werden. Auch 
diese Befunde stützen die Sichtweise, dass Übungen zur Verbesserung basaler 


300 © Frank & Timme Verlag für wissenschaftliche Literatur 


Sprachliche Heterogenität und Hörverstehen in Sprachprüfungen 


phonologischer Fertigkeiten auch bei Sprachkursen höheren Niveaus eine stär- 
kere Rolle spielen sollten. Durch die reziproke Verknüpfung von Sprachper- 
zeption und -produktion würde das Training dieser basalen phonologischen 
Fähigkeiten ebenso auf Ebene der Lautproduktion zum Tragen gekommen. Im 
Umkehrschluss bedeutet dies darüber hinaus auch, dass Aussprachetrainings 
und Lautproduktionsübungen auch in hohen Sprachniveaus zielführend für 
die Verbesserung von Hörverstehensleistungen sein können. 

Abschließend kann zweierlei konstatiert werde: 1. Die vorliegenden Ergeb- 
nisse sprechen dafür, die phonologische Spracherfahrung der Lernenden in 
der Lehre und der Prüfungsvorbereitung noch intensiver zu berücksichtigen. 
2. Es ist effektiv, psycho- und neurolinguistische Befunde noch stärker in die 
Prüfungsentwicklung mit einzubeziehen (ähnlich wie dies im Bereich Neuro- 
didaktik bereits geschieht). 
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